Skip to main content

OKHK 👀

Thinking...
❤️ PM:https://t.me/iokhk?direct
  1. Meta 发了三篇文章详细介绍 LLM 的训练过程以及微调。

    文章非常的干,都是 LLM 微调的关键要点,强烈推荐看看,下面是核心的笔记。

    - LLM 训练方法
    - 如何选择合适的训练方式
    - 如何判断是否需要微调 LLM
    - LLM 微调数据集准备
    - 数据质量/数量
    - 数据多样性
    - LLM的数据管道如何构建

    大语言模型训练方式:https://ai.meta.com/blog/adapting-large-language-models-llms/
    你是否需要微调模型:https://ai.meta.com/blog/when-to-fine-tune-llms-vs-other-techniques/
    如何微调:关注有效的数据集:https://ai.meta.com/blog/how-to-fine-tune-llms-peft-dataset-curation/

    https://m.okjike.com/originalPosts/66dea35bacacaa2766204e0d
  2. GFW 改变干扰 Docker 官方安装脚本域名方式

    有消息¹称当前 get.docker.comdownload.docker.com 中国大陆可以直连。经测试发现,首次可以正常访问,但会重置后续连接,并不是真正停止干扰,这么做可能只是为了营造网络不稳定的假相,与干扰 GitHub 的方式类似。

    Docker Hub 域名 hub.docker.com 依然完全无法直连。

    —— [1] V2EX
  3. 国行 iPhone 15 Pro 开通 Apple intelligence

    1. 下载 MisakaX

    https://www.github.com/straight-tamago/misakaX

    在 release 里

    2. 下载后把 App 移动到 Mac 应用程序文件夹里

    3. 打开,点「Intall pymobiledevices3」

    4. 下载快捷指令:
    https://www.icloud.com/shortcuts/e2077174cc424253a24164a1df674ac4
    运行后导出文件给 Mac.

    5. iPhone 连接数据线到 Mac,打开访达,信任计算机。

    6. 点 MisakaX 的 Apply

    7. 系统会重启

    8. 激活的时候选择【不要】抹掉

    9. 进入系统后系统语言、地区、和 Siri 语言三个都改成美国,iCloud ID 登录美区的

    10. Siri 会提示加入 Apple intelligence 候选

    11. 加入之后就可以使用了

    iOS 系统要升级到 18.1 Beta.
    如果不行的话就反复尝试,重启手机。
    确认关于本机的 Model Number 以 LL/A 结尾


    #Apple GitHub - straight-tamago/misakaX: iOS /iPadOS 16.0 - 18.0 / 18.1 beta 4, An ultimate customization tool, uilitizing the bug that…
  4. 京东自营原价12000元的2024款 MacBook Air 13寸 M3芯片 16GB + 512GB
    https://u.jd.com/tO1GMql

    配合最近北京市或者广东省政府补贴 8500 就可以拿下

    政府补贴领取:京东搜索地区名称
    如不在以上两地,用点科技改一下定位🐶
  5. #GitHub #AI #Tool

    kotaemon - 开源 AI 文档问答工具与文档对话

    开源文档问答工具,基于 RAG 技术,支持通过大型语言模型进行高效的文档检索和问答。

    它支持多用户、多模态文档的处理,以及复杂问题的推理和回答,能够集成 OpenAI、Azure 等多种 API 或本地模型。

    在线体验:https://huggingface.co/spaces/cin-model/kotaemon-demo GitHub - Cinnamon/kotaemon: An open-source RAG-based tool for chatting with your documents.
  6. FireCrawl可以将整个网站转换为可用于 LLM 的 Markdown 或结构化数据。使用单个 API 进行抓取、抓取和提取。

    说白了就是将一个 URL 转换为 Markdown,很方便的和各种大模型进行对接,而且还支持各种各样的 SDK。

    不想自己部署的话,可以直接使用它们的在线服务,直接转Markdown 格式,效果还不错。

    https://github.com/mendableai/firecrawl

    #AI #GitHub #Tool GitHub - firecrawl/firecrawl: 🔥 The API to search, scrape, and interact with the web for AI
  7. https://github.com/infrost/DeeplxFile

    基于 Deeplx/playwright 提供的简单易用,快速,免费,不限制文件大小,支持超长文本翻译的文件翻译工具。

    它能够处理复杂文档的大文件翻译,特别适用于 Excel、Word 等格式,提供高质量的中英互译,并且不限制文件大小。

    它支持多种模式,模拟浏览器操作 Playwright 模式,能够翻译大量文本且兼容性强。

    #GitHub #Tool
  8. Favicon 下载器 & API ,抓取站点识别 + 转发逻辑 - 抓不到图标则生成首字母 svg 替代。

    Github: Favicon Downloader

    Site: https://www.faviconextractor.com

    Favicon API

    Download Favicon

    Google Favicons

    DuckDuckGo Icons

    Wokers 版本:

    此版本加载效率最高,合适生产环境使用。

    https://github.com/seadfeng/favicons-proxy

    https://www.v2ex.com/t/1066532

    #GitHub #Tool #Cloudflare
OKHK