Skip to main content

OKHK 👀

个人数字泔水\(⁠◔⁠‿⁠◔⁠)
Thinking...
  1. Linux --- 快速复制大量小文件

    有时需要进行数据的备份和恢复, 若存在大量的小文件速度会很慢,可使用如下命令

    cd source/; tar cf - . | (cd target/; tar xvf -)
  2. #AI #GitHub

    📩 接读者来稿,他向我们推荐了自己的 RSS 订阅源 AI 总结开源项目

    📢 RSS-GPT:用 ChatGPT 总结 RSS 订阅源,并托管在 GitHub 仓库和 Pages 上

    🔗: GitHub | Wiki

    💡 原理

    使用 GitHub Actions 自动运行一个简单的 Python 脚本,调用 OpenAI API 总结订阅源中的文章,然后将新生成的 RSS 订阅源推送到 GitHub Pages。配置简单快速,无需服务器。

    👉 Features

    使用 AI 生成关键词以及摘要附在原文前面,支持自定义摘要长度,自定义语言。
    聚合多个 RSS 订阅源,去除重复文章,用单一地址订阅。
    为 RSS 源添加基于标题,内容,URL 的关键词过滤器。
    在 GitHub 仓库和 GitHub Pages 上自托管 RSS 订阅源,并在任意客户端中订阅。

    👍 作者在博客写了关于本项目的 简单介绍 以及 配置教程 ,并分享了几条 RSS-GPT 处理后的订阅源供大家参考订阅。

    👨🏻‍💻 作者的话

    RSS 是我主要的信息获取方式,我可以把关注的内容和创造者聚合在一起集中阅读。但如若不加筛选,富含噪音的 RSS 在订阅中堆积会让让人疲惫不堪。每天几百几千条未读产生,如果“强迫症和焦虑症患者”强求 RSS 也 inbox-zero 的话,每天会花费很多的时间执着于清空未读上面。

    在这种情况下,一个非常有效的方法就是,对 RSS 进行关键词过滤,只保留自己真正感兴趣愿意花时间阅读的内容。而另一方面,在关键词筛选玩完,对 RSS 全文的中文总结也很有意义,这样可以快速了解到这篇文章的主要内容,来决定是否进一步精读。

    所以我开发了这样一个工具,并尽量在保证 API 和 Actions token 使用的前提,满足这两个需求。目前仅支持 OpenAI API 调用,未来会考虑加上 Azure OpenAI 或自定义 OpenAI 代理地址,或加上更多 AI 模型支持。

    频道:@NewlearnerChannel

    source
  3. @bilibiliparse_bot,在线解析视频,目前已支持哔哩哔哩、抖音、小红书、推特、Instagram、油管、Tiktok、快手、皮皮虾、虎扑解析

    @web2album_bot 支持将推特、weibo、小红书、reddit、知乎的帖子转到电报,支持长截图分割

    @b23tvbot 去除 b23.tv 转换成 bilibili.com 后的追踪参数

    @msg_get_bot @Save_restricted_content_1bot @Save_Restrict_bot 频道消息提取器,破解频道/群组不允许转发保存限制,电报消息提取利器。

    @download_it_bot 支持下载 油管, Instagram, TikTok, FB, SoundCloud, Vimeo, VK, 推特 等一千个网站的视频

    @reddit_download_bot @RDTDownloaderBOT reddit下载器

    @sosdbot 搜书神器

    @KYTSearchBot Telegram 国际化索引机器人(速度比较慢,但是收录的比较全,无广告)

    @pixivbot pixiv下载器

    @TG_FileurlBot 电报文件转http下载链接

    @vkmusic_bot 音乐机器人无广告 @haoyybot @VmoMusicSearch 音乐机器人有广告

    @xiannvgong_bot 随机9张写真图
  4. https://m.okjike.com/originalPosts/65407a7e99f2123c74a4cd43

    在进行软件架构设计的时候,“C4 模型”可以很好地辅助表达一系列的分层图表,https://c4model.com,/它按照上下文(Context)、容器(Container)、组件(Component)和代码(Code)四个维度对软件架构的层级做了定义。

    之前一直是徒手画框,看到 PlantUML 已经内置了 C4 元素,使用简单的 DSL 就可以完成架构图的绘制,实在是太方便了!C4 还内置了一些主题,也可以通过 PlantUML 提供的语法对界面样式进行自定义,不过,一般也不用特别追求好看,内置的主题基本就够用了。

    另外,VSCode 上的插件名就是 PlantUML,它提供了一个包含大量示例的参考仓库:https://github.com/plantuml-stdlib/C4-PlantUML
  5. https://plug-world.com/posts/stop-obsessing-over-tools/

    我经常看到人们不断寻找最好的笔记 App、最好的 Linux 发行版、提高生产力的最佳 AI 软件、最好的游戏引擎......

    这样做并不会提高你的效率,你永远找不到最好或最完美的设置。我的建议是,只要一样东西足够好、能完成工作,你就不妨坚持用下去。不要盯着工具,而要盯着你要完成的工作。

    -- 《停止沉迷于工具》
  6. 开发不规范导致日志写入容器, 导致 K8s 节点磁盘空间占用过高,处理:

    通过监控告警来提前预防
    挂载磁盘, 容器日志写入磁盘
    使用自动清理脚本

    # kubectl查询每个pod占用磁盘空间
    kubectl get --raw /api/v1/nodes/10.200.200.1/proxy/stats/summary | jq '.pods[] | "PodName:  \(.podRef.name)", "usedBytes:   \(.containers[].rootfs.usedBytes)", "======================================================"'
    
    # Docker 查看容器磁盘占用
    # 节点上查看磁盘使用情况,并安装从大到小排序,可以看到各个容器的占用磁盘空间。
    docker ps -a --format "table {{.Size}}\t{{.Names}}" | sort -hr
    
    # 查看磁盘总体使用情况
    docker system df

    #Script
  7. git filter-branch --index-filter 'git rm --cached --ignore-unmatch yarr/data/yarr.db' --prune-empty -- --all

    #Script
    从Git仓库的整个历史(所有分支和标签)中,永久删除文件 yarr/data/yarr.db,但不会删除你当前工作目录中的该文件。
  8. #Script
    curl -sIL 分享链接 | rg -A 8 -m 1 "HTTP/2 302" | rg "location: " | cut -d ' ' -f 2 | cut -d '?' -f 1 | pbcopy

    从一个分享链接中,提取其重定向(302跳转)后的最终目标URL(不包含查询参数),并将其复制到剪贴板。
OKHK