碎片收藏 / 资讯文档 / 网站工具 / GitHub 项目 / Bing 壁纸
简单复盘一下 AWS 这次事件作为一个 AIGC Startup SRE 的一些操作吧,希望能帮到大家
从入职开始发现我们主要的集群在 USE1 之后,我就开始做一些准备了。
我主要做的事情有这几件事
1. 将我们核心的几个数据库做了多地的备份,形成了 USE1,Tokyo,SG 三地备份。这样在极端情况下,我们损失一部分数据,但是也能保证服务的继续
2. 将我们 SG 的测试集群从原本的 EC2 自己简单搭的 K3S,重构为了一个标准的 AWS EKS 集群。这样可以在灾害时刻快速 warmup 一个集群,复用 AWS 已有组件。将 manifest 变更的代价降至最小
3. 简单梳理了一个 SOP,包含用户公告,DNS 切换,封版等事宜

回到今天,我大概在 AWS 事故发生后的10min,发现了我们容器中有新的 Pod 无法 setup。

在和 AWS 支持确认是 USE1 的问题后,我意识到 ECR 的事件必然关联其余事件,于是我就果断按照我自己规划的 Tier1 等级事件开始处理(对于 SRE 来说,这种事情宁可错,但是不能错过)

T+0 min,我发布了全员公告,开始进入紧急模式。我 setup 了一个全员公开会议。所有人员可以随时加入
T+2 min,我确认事件如我所预期的一样,在逐渐扩大,我发出了两个指令,1. 全线禁止任何代码合入/提交(主要是避免新创建资源会导致 Pod rotate 进而影响流量),2. 请运营同学准备公告
T+3 min, 我开始按照 SOP,开始进行数据库在 SG 区域的恢复,并且级联创建诸如 OpenSearch / Redis 等在内的依赖
T+5 min,我们开始正式的确认上下游依赖的具体问题,确认一个新上线的核心服务受到影响
T+10min,我们停服公告和其余服务的受影响公告发出
T+10min,我请另外两位同时协助 setup 新的 ECR 以及清理测试环境已有资源,并同步 CTO ,在极端情况下,我们可能会存在保体验,丢数据的决策。
T+15min, 我们最终确认目前已创建的资源以及流量入方向不会受到太大影响。切换方案挂起,但是我们继续准备相关资源
T+30min,我们第一个数据库恢复完毕
T+40min,我们第二个数据库恢复完毕
T+1h,我们所有关联的核心 infra,RDS/ES/Redis 都 stand by,并且按照生产架构设置主从等优化选项。同时我们也开始正在新的集群启动新的服务
所幸,最终 AWS 的 crash 没有影响我们全部服务。我们无须面对切换流量后复杂的数据修复工作
大概 T+2h 到 T+3h 后,我正式通报全员,紧急状态解除。为保险起见,今晚依旧对 feature 封版。

回顾整个事故,我还可以做的更多
1. 将我之前为自己准备的极端 case SOP,对全员公开。这样确保我即便不在线,也有人能接替我
2. 我们可以做一些提前的预先演练
3. 指令下达可以更果断一些

差不多就是这样,一点分享,希望能帮到大家
https://cto.new/

又是一家做 AI Coding Agent 的,目前宣称永久免费提供主流模型(当下是 GPT5、Claude 4.5 Sonnet、Gemini 2.5 Pro)

当前登录使用需要邀请码,每个账户可以生成三个邀请码

6kdbsd5x8blz

jl5wzwmk8mdq

ckqj7n6wkwbd
cto.new - Completely free AI code agent
Scribe OCR - 对图片 / PDF 文件进行 OCR 数字化校对

https://scribeocr.com/

https://github.com/scribeocr/scribeocr

Scribe OCR 是一款免费的 Web 应用,可以当作 Adobe Acrobat 等应用的简单替代品。

专注于图像文本识别、高效 OCR 数据校对及创建完全数字化的原生文本文档,能够将扫描内容转换为准确、可搜索且可编辑的数字格式,包括电子书风格的 PDF 文档。

免费的网页端文本识别、OCR 校对及文档数字化应用。
完全基于浏览器客户端运行,确保数据隐私安全。
通过优化文本叠加和定制字体生成,实现精准校对。

#OCR #Image #PDF #Tool #GitHub
财经时事资讯简报生成器

https://github.com/SiyuanJia/brief

一键将新闻链接转化为精美的财经简报,集成 AI 内容提炼、智能高亮、自动插图生成和长图导出功能

一键生成:输入新闻链接,自动生成专业级财经简报
AI 驱动:智能提炼关键信息,自动标记重点内容
视觉精美:手绘风格插图 + 多彩高亮 + 专业排版

#AI #Tool #GitHub GitHub - SiyuanJia/brief: 一键将新闻链接转化为精美的财经简报,集成AI内容提炼、智能高亮、NanoBanana插图生成和长图导出功能
DeepSeek 的新模型思路看上去很神奇,为了解决 LLM 长上下文的问题用视觉模型去压缩文本。压缩率能到 10x-20x 虽然有损但是准确度还是很高的。最后还类比了人类的记忆,可以通过调节视觉图片的清晰度来控制上下文的准确程度,这个过程其实和人类的记忆衰退过程很接近。相比现在 LLM 上下文压缩都是用各种 prompt 针对不同任务用不同方法进行总结,直接降低图像的解析度确实听上去是个更优雅更合理的方法。

https://github.com/deepseek-ai/DeepSeek-OCR/blob/main/DeepSeek_OCR_paper.pdf DeepSeek-OCR/DeepSeek_OCR_paper.pdf at main · deepseek-ai/DeepSeek-OCR
AWS 美国 US-EAST-1 出现大面积故障

亚马逊云服务 AWS US-EAST-1 (美国东部-弗吉尼亚州北部)区域内多项 AWS 服务的错​​误率和延迟增加。同时包括Docker Hub、Snapchat、Steam、EPIC在内的大量服务在美国区域出现服务降级乃至完全中断,它们可能是因为使用了 AWS 的有关服务而受到了影响。

亚马逊正在调查处理该故障。

[消息等级 Level C · 一般]
一觉醒来发生了什么 10 月 20

2025 年 10 月 20 日
🌍 资讯快读
1、国家安全机关破获美国国家安全局重大网络攻击案
https://www.jiemian.com/article/13481991.html
2、上海首个知识产权全链条保护中心落地徐汇
https://www.jiemian.com/article/13482440.html
3、巴基斯坦和阿富汗同意立即停火
https://www.jiemian.com/article/13482026.html
4、印度“食脑虫”感染病例数激增,已致死 26 人
https://www.jiemian.com/article/13482109.html

👬 即刻镇小报
1、搞学术的人看过来
https://m.okjike.com/originalPosts/68f1e38684359544fe6d5a81
2、颈肩不舒服的朋友可以试试
https://m.okjike.com/originalPosts/68f1da6684359544fe6ca7f4
3、产品经理如何打造属于自己的 AI 工作流
https://m.okjike.com/originalPosts/68f1d2b5ff354faaf5d58e04
4、 HeyGen 宣布达到了 100M ARR 的重大里程碑,并公布了其内部的 Bible
https://m.okjike.com/originalPosts/68f19339d9abb9785db6812e

今日即刻镇小报内容来自 @Max_means_best @小熊猫不着急 @西里森森 @orange.ai ,感谢以上即友的创作与分享。
#Bing_Wallpaper

慢节奏的生活

霍氏树懒,厄瓜多尔 (© Murray Cooper/Minden Pictures)

4K | 1080P
蛐蛐 (QuQu) - 开源免费的 Wispr Flow 替代方案 | 为中文而生的下一代智能语音工作流

https://github.com/yan5xu/ququ

离线语音输入,无需会员,不连云端,保证隐私。


蛐蛐 (QuQu) 是 一个开源免费的 Wispr Flow 替代方案, 专为中文用户打造的注重隐私的桌面端语音输入与文本处理工具。

它集成了阿里巴巴开源的 FunASR 本地语音识别模型, 并支持配置国内顶尖的大语言模型, 提供高精度的中文语音转文字和智能文本优化功能。

完全免费开源, 数据本地处理, 保护用户隐私
专为中文优化, 支持国产 AI 模型如通义千问、Kimi 等
独创 "ASR 精准识别 + LLM 智能优化 " 的两段式引擎
能准确识别并格式化编程术语, 支持自定义 AI 指令
提供全局快捷键唤醒, 实时识别和无缝粘贴功能

#AI #Voice #Tool #GitHub GitHub - yan5xu/ququ: 开源免费的 Wispr Flow 替代方案 | 集成FunASR本地模型和可配置大语言模型的下一代中文桌面语音工作流
Fake News Detector - AI 虚假新闻检测器

https://github.com/CaptainYifei/fake-news-detector

在 AI 不产生幻觉的场景下,打假还是可靠的


一个基于事实核查的智能新闻验证系统,支持多语言、多模型提供商,使用先进的语义嵌入技术和大型语言模型进行准确的事实核查。

#AI #Tool #GitHub GitHub - CaptainYifei/fake-news-detector: 基于AI和证据搜索的虚假新闻自动检测系统
rathole - 高性能内网穿透工具(Rust)

https://github.com/rathole-org/rathole

rathole 是一个用 Rust 语言编写的安全、稳定、高性能的内网穿透(反向代理)工具,用于让 NAT 后的设备上的服务通过具有公网 IP 的服务器暴露在公网上。

可以作为 frpngrok 的替代品。

高性能:吞吐量远高于 frp 等工具,在高并发场景处理大量连接时更稳定
低资源消耗:内存占用远低于同类工具
安全性:每个服务单独强制鉴权。Server 和 Client 负责各自的配置。使用 Noise Protocol 可以简单地配置传输加密,而不需要自签证书。同时也支持 TLS。
热重载:支持配置文件热重载,动态修改端口转发服务。HTTP API 正在开发中

#Network #Tool #GitHub GitHub - rathole-org/rathole: A lightweight and high-performance reverse proxy for NAT traversal, written in Rust. An alternative…
一觉醒来发生了什么 10 月 19

2025 年 10 月 19 日
🌍 资讯快读
1、著名物理学家、诺贝尔物理学奖得主杨振宁逝世
https://www.jiemian.com/article/13481363.html
2、我国生成式人工智能用户规模超 5 亿
https://www.jiemian.com/article/13480996.html
3、柬埔寨遣返 64 名韩国网络诈骗嫌疑人
https://www.jiemian.com/article/13481418.html
4、熊袭人事件增多,日本将强化熊种群控制
https://www.jiemian.com/article/13481465.html
5、国家管网集团首个地面集中式大型光伏发电项目在新疆并网
https://www.jiemian.com/article/13481549.html

👬 即刻镇小报
1、AI 时代,知识会过时,但思维方式不会
https://m.okjike.com/originalPosts/68f32265cc3970b79d9bc80a
2、几个有意思的城市数据
https://m.okjike.com/originalPosts/68f20e2bd9abb9785dbffdb3
3、Claude code 发布 skills 的 6 条解读
https://m.okjike.com/originalPosts/68f205d200c0686ab5875b80
4、月入 60 万的 AI 产品长什么样
https://m.okjike.com/originalPosts/68f201c11ed9b53c785d2000

今日即刻镇小报内容来自 @Alchian 花生 @广屿 Ocean @SUKIII @向度之桥 ,感谢以上即友的创作与分享。
#Bing_Wallpaper

痴迷科学

即将收获的苹果,明尼苏达州,美国 (© Tammi Mild/Getty Images)

4K | 1080P
Back to Top
OKHK