2026年5月宝藏资料丨每日分享 – 格律诗的软件世界

Contents

2026-05-24
2026-05-18
2026-05-11

2026-05-24

公务员从入门到上岸，最佳程序员公考实践教程

项目地址：https://github.com/miss-mumu/developer2gwy

OpenHuman：一个开源的「个人 AI 超级智能」

记忆树（Memory Tree）
接入你的 Gmail、Notion、GitHub、Slack、Calendar 等工具后，系统每 20 分钟自动拉取一次新数据，把所有内容压缩成 Markdown 片段，存进本地 SQLite，同时生成一个 Obsidian Wiki 仓库。
桌面吉祥物
它有一张脸，会说话，能感知周围环境，甚至能作为真实参与者「加入」你的 Google Meet 会议，还能在你停止打字后在后台持续思考。
118+ 第三方集成 + 智能 Token 压缩
所有工具调用、邮件内容、搜索结果都经过压缩层处理，号称可以降低最多 80%的 token 消耗。
完全本地优先、开源
数据存在本机，加密本地。可以选择接入 Ollama 跑本地模型。

项目地址：github.com/tinyhumansai/openhuman

《小词活用 3000 题》免费分享

这两天很多同学上来留言，问我有没有《小词活用 3000 题》。我问了一下才知道这本书被小红书上面一个博主推荐了。

但比较尴尬的一点是，《小词活用 3000 题》是很多年前写的，现在已经绝版了，后面也不会有重印计划。现在我不仅手头没有书，连当年留存的电子资料也丢了。刚刚想去电商平台上买二手的也买不到。

如果哪位同学手里有这本书，可以尝试做成扫描版共享出来，不然它就永远绝版了（来自 @ SCUT 魏剑峰）

https://pan.quark.cn/s/85fd9d5b2150

Agency Agents – 把现实世界里几乎所有职位都做成了 AI 员工

又发现一个变态级别的开源项目，作者把现实世界里几乎所有职位都做成了 AI 员工。前端开发、UI 设计、自媒体运营、销售、市场分析师、数据工程师、法务顾问，你能想到的工种基本都有。目前已经做了 144 个，还在持续更新。

GitHub 星标直接冲到了 6 万+，完全免费开源。

用法也很简单，在小龙虾或者 Claude code 里跑，几分钟就能搭起一整个虚拟团队。你需要哪个工种的能力，就直接调对应的 AI 员工，随时上手干活。

特别适合那种「确实需要某项专业能力，但又不值得专门招一个人」的场景。独立开发者、一人创业者、小团队，用这个项目能省掉不少事。

项目地址：github.com/msitarzewski/agency-agents

公众号爆款文章查询助手（Skill 工具）

做公众号最头疼的问题，很多人以为是写作能力不行，其实是选题。你不知道写什么，写出来也没人看，核心原因是内容没有击中算法。

现在公众号已经从订阅制变成了算法推荐，粉丝多少不再是决定因素，关键在于你的文章能不能进入推荐流量池。所以哪怕你是个新号、低粉号，只要选题对了，照样能跑出高阅读量，照样能通过流量主赚到广告收益。

那怎么找到好选题？有个很实用的思路：去看那些低粉爆款文章。就是那种账号粉丝很少，但阅读量特别高的内容。这类文章能火，说明选题本身就有极强的算法亲和力，跟账号体量无关。你参考类似方向去写，进推荐池的概率自然大得多。

给大家推荐了一个免费的Skill工具，叫”公众号爆款文章查询助手”，干的就是这件事。操作特别简单，三步就搞定：第一步，用自然语言说一句话，比如”帮我找近7天职场爆款文章”；第二步，工具会自动把大方向拆成多个细分领域让你选，比如离职焦虑、职场沟通等；第三步，追加”低粉爆款”条件，精准锁定那些小号写出的高阅读文章。

这个工具有几个亮点：全程免费，不用开会员；用对话方式查询，不用层层点击菜单；每天收录1000多条10w+文章，覆盖情感、职场、育儿、科技各个赛道；还能智能拆分细分方向，帮你把模糊的想法变成精准的选题。

使用技巧也值得记一下：关键词越具体越好，比如搜”婚姻中年危机”比搜”情感”精准得多；善用时间限定，近7天看趋势，近30天看全貌；每次查询结束推荐的细分词本身就是很好的灵感来源。

目前这个工具在WorkBuddy和coze上都能用，搜索”公众号爆款文章查询”就能找到。对于有选题焦虑的自媒体创作者来说，动笔之前先看看最近什么方向容易火，比闷头硬写效率高太多了。

coze地址：www.coze.cn/skills?skill_share_pid=7626698034667683886

skillhub：skillhub.cn/skills/gzh-explosive-content-detector

clawhub：clawhub.ai/yuanyi-github/gzh-explosive-content-detector

Kimi Web Bridge – 浏览器插件，专为 AI Agent 设计的浏览器插件

可让 AI 帮你打开网页、点击按钮、填写表单、提取信息，自动化各种网页操作链接：www.kimi.com/features/webbridge

Awesome Design Skills – 提供了 67 套现成的设计系统技能文件

用 AI 写前端界面，最头疼的一个问题就是生成出来的风格千篇一律。你想要毛玻璃效果，想要极简风，每次都得在提示词里反复描述，来来回回调，确实费劲。

最近刷到一个叫 Awesome Design Skills 的开源项目，挺有意思的。它提供了 67 套现成的设计系统技能文件，风格覆盖面很广，毛玻璃、新拟态、像素复古、企业级、编辑排版风格都有，基本上常见的设计风格都能找到对应的方案。

它的用法也很简单。每套技能包含两份文件，一份是给 AI 读的指令规范，一份是给我们人看的设计说明。你只需要一条命令就能把它们全部拉到项目里，然后 AI 就会按照规范去生成界面，不用你再手动描述风格了。

适配方面，目前已经支持 Claude Code、Codex 等主流 AI 编程工具。而且它还提供了交互命令，可以浏览预览各种风格，甚至自己生成一套自定义的设计规范。

如果你经常用 AI 写前端，但苦于界面风格不可控，每次都要花大量时间在提示词上调样式，这个项目能帮你省不少事。

项目地址：http://github.com/bergside/awesome-design-skills

用 Obsidian Web Clipper，让豆瓣种草更容易

如果你同时是 Obsidian 和豆瓣的用户，或许也遇到过类似的烦恼：在豆瓣上，如果看到一本感兴趣的书，单击一下「想读」就可以种草。但如果想同步记录到 Obsidian，却需要手工复制书名、作者等信息。
其实，解决这个困扰的思路并不复杂，只需要使用 Obsidian Web Clipper，加上自定义的剪藏模版，就能轻松搞定。
原文：https://sspai.com/post/109318

吴恩达老师的最新提示工程课程：Full AI Prompting Course with

视频地址：http://t.cn/AX6tupzy

Vibe Vibe – Datawhale 推出的首个系统化 Vibe Coding 开源教程

面向零基础学习者，从「有想法」到「做产品」提供完整路径。教程践行 Andrej Karpathy 提出的 Vibe Coding 理念，通过自然语言与 AI 对话，让编程从「写代码」转变为「对话式创作」。内容分为基础篇、进阶篇、实践篇和优质文章篇四大板块，覆盖 AI 编程心法、全栈技术栈、项目实战和行业资源追踪，支持零基础、大学生、创业者等多种人群。教程已提供 Docker 一键部署方案，未来还将上线云端 IDE 与 50+ AI Skills，进一步降低学习门槛。项目地址：github.com/datawhalechina/vibe-vibe
在线地址：www.vibevibe.cn

Anthropic 官方发布的 Skill 构建指南（来自@歸藏的AI工具箱）

https://pan.quark.cn/s/a2ae377828ba

Chrome 的 AI 功能占用 4G 内存，太夸张了… 如果不用可以这样关闭：

在 chrome://settings/system，关闭 On-device AI 选项
chrome://flags，关闭所有与 optimization guide 和 Gemini Nano 相关的
最后删除 chrome 用户数据文件夹下的 OptGuideOnDeviceModel 文件夹

买了 Mac Mini 当服务器，没显示器怎么办？一招搞定

最近不少人因为 OpenClaw（龙虾🦞）入手了 Mac Mini，打算拿来跑模型或当开发服务器。但问题来了：专门给它配一台显示器，既占地方又浪费钱。其实 macOS 自带的”屏幕共享”功能就能完美解决这个问题——用你现有的 Mac 直接远程操控 Mac Mini，就像坐在它面前一样。
设置方法很简单，两步就行：
第一步，在 Mac Mini 上打开屏幕共享。进入”系统设置” → “通用” → “共享”，把”屏幕共享”打开。如果 Mac Mini 还没连显示器做初始设置，可以先临时借一台显示器或电视，用 HDMI 接上完成这一步。
第二步，在你日常用的 Mac 上打开”屏幕共享”App（在”应用程序”里搜 Screen Sharing 就能找到），输入 Mac Mini 的 IP 地址或主机名，点连接，输入账号密码就行了。连上之后，Mac Mini 的整个桌面就出现在你面前，鼠标键盘都能正常操作。
几个实用技巧：连接时可以选”高性能”模式（需要 Apple 芯片 + macOS Sonoma 14 以上），画面更流畅。两台机器之间还能直接拖拽文件互传，剪贴板也可以共享，复制粘贴无缝衔接。
这样你的 Mac Mini 就可以安安静静藏在角落跑任务，需要的时候随时从主力 Mac 上远程连过去操作，省掉了一台显示器的钱和桌面空间。

2026-05-18

Prompt 高手李继刚的 Claude Code 自定义技能集

https://github.com/lijigang/ljg-skills

微信输入法 Mac 版可以自定义快捷键

微信输入法 Mac 版可以自定义快捷键了，试了下挺好用，输入的准确率和速度都挺快，并且也是实时显示的，推荐。

Claude for Legal – Anthropic 出品12 个针对具体法律岗位的插件

Anthropic 近日正式上线了一个叫做「Claude for Legal」的仓库，一口气放出了 12 个针对具体法律岗位的插件，以及超过 20 个连接行业常用软件的 MCP 连接器。

无论你是公司法务、打并购战的律所、专注隐私和 AI 治理的法律顾问，还是每天苦熬到半夜的诉讼律师，甚至是法学院里摸爬滚打的学生，这个仓库都给你准备好了对应的 AI 工具，直接在 GitHub 上开源了。

这些插件用之前不是即插即用，你得花 10 到 20 分钟，带着 Claude 做个简单的“冷启动访谈”，把你团队的 playbook、模板和风格习惯都塞进一个叫 CLAUDE.md 的本地文件。这样，以后每个插件干活儿的时候，都自动按照你自家的风格和标准来。

Anthropic 这么搞，是为了彻底解决 AI 法律工具最常见的槽点：输出内容太通用，看起来不像哪家律所自己的东西。

Anthropic 还是挺懂律所的痛点的。

比如 Vendor Agreement Reviewer 插件，它能自动对照你家合同模板改供应商协议，还贴心地输出一份 redline 备忘录；
又比如 NDA Triager，帮你自动把涌进来的 NDA 文件按绿黄红分级，绿灯放行、红灯直接推律师处理；
Claim Chart Builder 插件可以一键生成专利侵权对比表；
Privilege Log Reviewer 自动帮你跑第一轮特权日志审查；
而 Docket Watcher 插件则不知疲倦地盯着法院动静，帮你把最新动态实时扫进来。

简单讲，就是把律所里最烦、最机械、最浪费人力的活，变成了一个个简单的 slash command。

如果说插件解决的是律所内部效率问题，那么对行业系统的深度接入才真正体现 Anthropic 的野心。

现在，Thomson Reuters 的 CoCounsel、Harvey，还有 iManage、NetDocuments、Ironclad、DocuSign、Everlaw、Relativity、Box、Datasite 等几乎所有你能叫得上名字的平台，全都接入了官方 MCP 连接器。日常办公的 Word、Excel、Outlook、PPT 也全线打通。合同改完后，Claude 甚至会直接输出成 Word 修订模式，律师一条条接受或拒绝就行。

Anthropic 不只是把目光停留在高端律所。他们还特意做了些更「接地气」的事儿，联合 Free Law Project 和 Justice Technology Association，给法律援助机构、公设辩护人、非营利法律组织推出特别折扣，连给普通当事人设计的 Courtroom 5 工具也接进来了。这点挺让人感触的，因为美国大约八成民事诉讼里的原被告，根本请不起律师。

Claude for Legal 背后的大脑是刚升级的 Claude Opus 4.7 模型。Anthropic 很谨慎地强调：所有插件输出都是“仅供律师审阅的草稿”，绝对不能替代律师的专业判断。

README 文件里反复提醒：引用必须追踪来源，涉及特权和主观法律判断时，要默认保守处理。毕竟法律这件事，AI 还是不能完全代替专业律师。

项目地址：github.com/anthropics/claude-for-legal

官方博客：https://claude.com/blog/claude-for-the-legal-industry

CodeWiki – 谷歌出品，一键将GitHub 仓库变成一份可交互的文档

谷歌悄悄发了一个工具，叫 CodeWiki，专门解决一个问题：看不懂别人的开源项目。

用法很简单，把一个 GitHub 仓库链接丢进去，AI 会直接把整个代码库变成一份可交互的文档。

它做的事情比简单的代码总结要深入得多。它会自动生成架构图和依赖关系图，让你一眼看清项目的整体结构。然后逐个模块拆解，讲清楚每一块是怎么跑起来的，模块之间怎么配合。同时还会配套生成一份保姆级的使用教程，从环境搭建到跑通第一个 demo，全都给你安排好。最后还内置了一个聊天机器人，这个机器人读过整个代码库，你随时可以追问细节。

以前接手一个陌生的开源项目，光看懂目录结构和文件之间的调用关系，就得花上大半天甚至更久。现在直接丢进去，几分钟就能搞清楚整个项目的脉络，上手速度快了不止一个量级。

官方地址：codewiki.google

增强阅读体验，AI 对话时，在问题最后加一句”把回答用 HTML 格式输出”

Andrej Karpathy 最近分享了一个很实用的小技巧：跟 AI 对话的时候，在问题最后加一句”把回答用 HTML 格式输出”，然后用浏览器打开生成的文件，阅读体验会好很多。他自己试过让 AI 把内容做成幻灯片，效果也不错。

他更深层的思考是关于人和 AI 之间的信息传递方式。他觉得人类给 AI 输入信息，语音是最自然的方式；而 AI 给人类输出信息，视觉才是最高效的通道。毕竟我们大脑大概三分之一的区域都在处理视觉信息，这相当于一条十车道的高速公路，带宽远超文字阅读。

他列了一个 AI 输出形式的演进路线：最早是纯文本，读起来费劲；然后是 Markdown，有了加粗、标题、表格，稍微好看一点，这也是现在的主流；接下来就是 HTML，虽然底层还是代码，但在排版、图形、交互性上灵活太多了，正在成为新的默认选项。再往后看，终极形态可能是某种由神经网络直接生成的交互式视频或模拟环境，类似最近很火的那些 AI 生成的沉浸式体验。

输入端同样有改进空间。光靠语音、文字或视频都不够，比如你经常需要指着屏幕上的某个东西跟 AI 说”就是这个”，就像你身边坐着一个人帮你看电脑一样。

评论区的反馈也很有意思。有人说用了一周 HTML 输出，方向是对的，但每次回复的 token 消耗是 Markdown 的两三倍，成本不低。也有人提到 Claude 有时候会自己主动生成 HTML 来展示结构化信息。还有 Meta 的员工说他们内部天天互相发 HTML 做报告和原型，但没法直接评论协作，只能截图发群里聊。

总的来说，人和 AI 之间的沟通界面还处于很早期的阶段，在脑机接口真正到来之前，光是在输入输出的形式上做文章，就还有巨大的提升空间。

做自媒体的人的错觉

做自媒体的人有一个普遍的幻觉：先把内容做好，粉丝涨起来，钱自然就来了。

钱不会自然来。赚钱是一种独立的能力，跟你会不会写文章、会不会拍视频，是两件完全不同的事。你见过太多百万粉丝的大 V 赚不到钱，也见过只有几千粉丝的人活得很滋润。区别在哪？区别在于后者从第一天就在思考商业逻辑，前者一直在等一个永远不会自动到来的时刻。

等，是第一个坑。

你觉得粉丝不够多，还不到变现的时候。但赚钱这件事跟粉丝数量的关系，远没有你想象的那么大。你真正需要想清楚的是三个问题：我能提供什么价值？谁需要这个价值？我凭什么比别人做得好？这三个问题想清楚了，一百个精准粉丝就够你赚钱了。等到一百万粉丝再想这些，你会发现你根本不知道怎么开口谈钱。

急，是第二个坑。

信任是变现的前提。你刚认识一个人，第一次见面就问人家借钱，谁会借给你？自媒体也是一样。你得先持续输出有价值的内容，让别人觉得你靠谱、你专业、你值得信赖。这个过程急不来。但注意，建立信任和等待流量是两回事。建立信任是主动的，是你每天在用内容筛选跟你价值观匹配的人。等待流量是被动的，是你什么都不想就在那耗着。

不做产品，是第三个坑。

很多人只盯着内容爆不爆、流量大不大，从来不想赚钱的具体路径是什么。没有产品，流量就是空转。更危险的是，免费流量会骗你。点赞和评论不代表真实需求，只有真金白银的付费才是市场在告诉你：这个东西真的有人要。

所以正确的节奏是什么？

从第一天就开始想你的产品是什么，哪怕只是一个粗糙的雏形。同时用内容建立信任，筛选出对的人。产品不完美没关系，先推出去，让市场给你反馈，然后迭代。赚钱的能力只能在实践中长出来，你在脑子里想一万遍也长不出来。

说到底，很多人做自媒体不敢谈钱，背后是对自己价值的不认可。你觉得自己提供的东西不值得收费，你觉得谈钱很俗，你害怕被拒绝。但纳瓦尔说过，如果你创造了真实的价值，收费是对双方的尊重。免费反而是一种不负责任，因为免费的东西，别人也不会认真对待。

不要等，别着急，做产品。这九个字就是自媒体赚钱的底层逻辑。（来自默庵·超级个体）

微信群聊总结 Skill

Baoyu-skills github.com/JimLiu/baoyu-skills 新加了一个 Skill

微信群聊总结 Skill： https://github.com/jackwener/wx-cli

依赖于 wx-cli： https://github.com/JimLiu/baoyu-skills/tree/main/skills/baoyu-wechat-summary

如何配置使用 wx-cli 请看项目文档，无法提供帮助。另外目前只是借助其读取数据，其他没任何关系。

Claude Code + Claude Opus 4.6 效果最佳（来自@宝玉 xp）

mimo2codex – 让最新版 OpenAI Codex CLI / Codex 桌面端接入DeepSeek 、小米Mimo等模型的一个代理工具。

内置小米 MiMo V2.5 与 DeepSeek V4 Pro，并提供通用 provider 机制——不改任何代码、不重新发包，就能把任何 OpenAI Chat Completions 兼容（Qwen / GLM / Kimi / 本地 vLLM / Ollama / LM Studio …）或原生 Responses API（OpenAI 自家）的上游接到新版 Codex。把 Codex 的 Responses API 实时翻译成上游的 Chat Completions API，按客户端发的 model 字段在 provider 之间自动路由。可配 admin Web 控制台。

项目地址：github.com/7 as 0 nch/mimo 2 codex

Muapi – 把 200+个 AI 模型全部整合到一个 API，提供了最全的图片视频生成解决方案。

内容创作者经常需要访问多个AI平台，图片用Flux或Midjourney，视频用Kling或Sora，唇同步用InfiniteTalk，还得单独找扩散模型和 upscale 工具，来回切换API Key超级麻烦。

Muapi 把200+个AI模型全部整合到一个API，提供了最全的图片视频生成解决方案。

不仅有Seedance 2.0、Veo3、Sora 2 Pro等顶尖文生视频和图生视频，还支持Nano Banana 2、Flux Kontext、唇同步、多图参考编辑，甚至本地推理和无限预算电影工作流。

主要功能：

文生图/图生图，支持Flux、Nano Banana 2、Seedream 5.0、Midjourney等50+模型；
文生视频/图生视频，集成Kling v3、Sora 2、Veo 3.1、Wan 2.7等60+模型；
唇同步，支持InfiniteTalk、LTX Lipsync等9个专业模型，图+音频/视频+音频；
多图输入，支持最高14张参考图的编辑模型（Nano Banana 2 Edit等）；
电影工作室，专业相机控制（镜头、焦距、光圈），生成电影级画面；
工作流工作室，节点式多步AI管道，社区模板一键运行；
本地推理，双引擎支持（sd.cpp + Wan2GP），Mac M系列/RTX GPU全兼容。支持Web/Desktop多平台，pay-as-you-use计费，无订阅限制，适合个人创作者、营销团队和开发者使用。（来自@爱可可-爱生活）

官网地址：muapi.ai

项目地址：github.com/Anil-matcha/Open-Generative-AI

Pixelle-Video – 阿里国际 AI 团队出品，全自动爆款短视频内容工厂

一个大厂开源的全自动爆款短视频内容工厂，16.3 k Stars。

来自阿里国际 AI 团队，底层基于 ComfyUI 架构，支持各大 LLM（大语言模型）、TTS（语音合成）和生图/视频模型（如 Flux、WAN 2.1）的灵活插拔。

支持云端部署，还有本地 0 元免费方案。

当前功能还在不断更新中，不仅支持竖屏/横屏文案生成短视频，还新增了自定义素材输入、声音克隆、数字人及视频动作迁移（跳舞小猫等）功能，并推出了适合小白的 Windows 一键整合包。

项目地址：github.com/AIDC-AI/Pixelle-Video

Claude 官方出品 Claude Code 的教程

Claude 官方在油管出了 Claude Code 的教程，推荐观看： youtube.com/playlist?list=PLmWCw1CzcFilebjK89WLb5cAvM8K0cLB3

ChatGPT App 已支持手机远程控制电脑的 Codex

手机终于能远程控制电脑的 Codex 了！打开 ChatGPT App 现在会多一个 Codex 选项，配对上后可以远程查看、指挥、审批 Codex 正在电脑执行的任务，目前就能用上。 Codex 已经远不止是一个编程工具，控制电脑、操作浏览器、帮你生成视频、Word、PPT、填写表单等等，现在又能用手机 Codex 远程控制电脑替你完成任务，AI Agent 又往前迈了一大步。

吴恩达教授主讲的新课程《AI Prompting for Everyone》

官方地址：http://deeplearning.ai/

视频教程：https://www.deeplearning.ai/courses/ai-prompting-for-everyone/

Vibe coding入门手册

官方地址：https://zread.ai/tukuaiai/vibe-coding-cn

网络安全/CTF入门教程：Hello CTF

官方地址：hello-ctf.com/

微信读书 Skill

https://weread.qq.com/r/weread-skills

Story to Game – 把小说/剧本转成可玩的分支文字游戏

这个开源项目不错啊，可以一键把故事剧本转换成实时互动的文字游戏！😲

Shanyin-ai/Story-to-game 是一个“互动文游生成与运行套件”：一边提供 HTML 单文件游戏启动器，负责加载 JSON 剧本并游玩；另一边提供 Story-to-Game AI skill，把小说、剧本、故事大纲转成符合规范的分支剧情 JSON。

启动器纯前端、无依赖，直接浏览器打开即可。支持书架管理、导入 JSON、选项交互、回退、存档/读档、章节检查点、变量/flag、条件选项、自动路由、结局和成就系统，也能调整明暗模式、字号、动效和自动播放速度。

更有意思的是 AI skill：它不是只把故事切成几个选择题，而是明确设计了“原作理解 → 风格保真 → 分支设计 → 状态系统 → 自动验证”的改编流程，还用 validate.py 做节点可达性、引用完整性、结局完整性等 13 项校验。

一句话判断：这不是把小说游戏化，而是把小说拆成一个可运行的叙事状态机。

项目地址：https://github.com/Shanyin-ai/Story-to-game

马斯克的 x 推荐算法开源库更新

“本次发布更新了 For You 算法代码，包括一个可运行的端到端推理流水线，以及用于内容理解、广告和候选内容来源的新组件。

端到端推理流水线：新增的 phoenix/run_pipeline.py 用单一入口替代了原先分开的 run_ranker.py 和 run_retrieval.py 脚本。它可以基于导出的 checkpoints 执行 retrieval → ranking 流程，模拟生产环境中两个阶段的组合方式。

预训练模型 artifacts：现在提供了一个预训练的 mini Phoenix 模型，包含 256 维 embeddings、4 个 attention heads、2 层 transformer。该模型被打包为约 3 GB 的归档文件，并通过 Git LFS 分发，使用户无需先训练自己的模型即可直接进行推理。

Grox 内容理解流水线：新增 grox/ 服务，提供 classifiers、embedders 和任务执行引擎，用于 spam detection、post-category classification、PTOS policy enforcement 等内容理解任务。

广告混合系统：新增 home-mixer/ads/ 模块，用于处理 feed 中的广告插入和位置安排，并包含 brand-safety tracking，能够遵守敏感内容边界。

Query hydrators：Home mixer 现在会补充用户上下文，包括 followed topics、starter packs、impression bloom filters、IP、mutual follow graphs 和 served history。

Candidate hydrators：新增用于 engagement counts、brand safety signals、language codes、media detection、quote post expansion、mutual follow scores 等信息的 hydrators。

Candidate sources：新增 ads、who to follow、Phoenix MoE、Phoenix topics、prompts 等来源，并更新了 Thunder/Phoenix 相关来源。”

项目地址：github.com/xai-org/x-algorithm

商品历史价格查询的 iOS #快捷指令

点开后，右上角用浏览器打开。 官方地址：https://www.icloud.com/shortcuts/aa00494c4b134daeaa05faf32fed6c0b

Harness 完全指南：harness 是一切工作的核心（1.3万字）

文章来源： https://mp.weixin.qq.com/s/Pbhyg8PPHNzhWbMLI732eA

2026-05-11

网络安全面试题大全

github.com/duckpigdog/Sec-Interview/

AI 辅助写小说的新做法

AI 辅助写小说的新做法：给每个主要角色单独建一个 AI 智能体。每写一章前，先让 AI 把每个角色当下的认知状态和压力状态过一遍，再决定他这一章去找谁、说什么、做什么。

开源 Harness Engineering 教程

Learn Harness Engineering 是一门专注于 AI 编程智能体工程化落地的课程

项目地址：https://walkinglabs.github.io/learn-harness-engineering/zh/

电子书看书的 1-2-3 法则

就是只用一个看书软件，一般是 KOReader，其它软件都删掉。
就是只放两本电子书，不要放更多，看完其中一本删掉，换新的。
就是三章不弃原则。当然有可能雄心壮志太大没准备好，看不下去。但是原则是书看前三章，三章之内绝不弃坑。

秉持 1-2-3 法则就能最大化电子书的阅读效率，实际上也就最大化了时间利用率

Anthropic 发布 Claude Office 365 套件

AI 竞争正在从“聊天机器人能力”，进入“谁能接管真实工作流”。

Anthropic 把 Claude 全面塞进了 Microsoft 365。Excel、PowerPoint、Word 三个插件从 beta 转为正式版（GA），Outlook 插件同步进入公测。

意味着不用再切到 claude 网页端，可以在 Excel 表格里、PPT 幻灯片上、Word 文档中、Outlook 邮箱里直接喊 Claude 干活。

真正的卖点是跨应用的上下文衔接。Anthropic 给的典型场景：先在 Outlook 里让 Claude 整理收件箱、起草回复，顺手打开邮件里附的 brief 到 Word；接着让它根据 Word 简报在 Excel 里搭财务模型，公式分布在多个 sheet；再做成 PowerPoint，最后回到 Outlook 起草评审邀请。整个流程里 Claude 带着前一步的上下文走，不需要重新喂材料。

具体能力上，Excel 里 Claude 能改单元格和假设条件而不破坏现有公式；PowerPoint 里它按你的模板排版，生成原生图表而不是塞图片；Word 里改稿用 tracked changes（修订模式）呈现，让你逐条接受或拒绝；Outlook 里草稿会停在草稿箱等你点发送。

定价方面，所有付费 Claude 套餐用户都能用，不需要额外掏钱。

视频地址：http://t.cn/AXJ1qIfc

使用地址：https://claude.com/claude-for-microsoft-365

OpenAI 给 Codex 推出了 Chrome 扩展，让它能直接在浏览器里干活

Mac 和 Windows 用户从今天起可以在 Codex app 里安装 Chrome 插件，让 Codex 直接在浏览器里执行任务，并且支持后台多标签并行运行，不会霸占你正在用的浏览器界面。

Codex 是 OpenAI 的编程 agent，之前主要活动范围是终端、IDE 和云端。这次进入浏览器后，它能处理那些必须登录才能完成的活儿，比如查内部后台、刷 dashboard、在 CRM 里更新客户信息、走完需要点好几个页面才能完成的复杂表单流程。

工作方式上，Codex 通过写代码、跑代码来操作页面。一个任务如果涉及多个工具，它会自己挑：能用现成插件搞定就用插件，必须登录的网站就走 Chrome，需要时两边混着来。

OpenAI 给出的典型用例包括调试浏览器里的业务流程、做调研、更新 CRM 记录、处理结构化页面里的重复数据录入。

今天就能在 Codex app 里启用，欧盟和英国暂未开放，OpenAI 表示后续支持。

视频 1：http://t.cn/AXJ1q88g
视频 2：http://t.cn/AXJ1q8RP
视频 3：http://t.cn/AXJ1q8RG

OpenAI 上线了官方命令行工具 openai-cli，开发者可以直接在终端里调 API，不用再写 SDK 代码

项目开源在 GitHub (openai/openai-cli)，Apache 2.0 协议，可通过 Homebrew 或 Go 安装。命令走资源化结构，比如 openai responses create –input “…” –model 这样的写法。

工具的几个核心能力：

调用 Responses API，并且支持所有 cloud tools，也就是 OpenAI 托管的内置工具，包括 web 搜索、代码解释器、文件检索、图像生成等。换句话说，agent 风格的工作流也能直接从命令行跑通。

输出走 Unix 风格的结构化格式（JSON、YAML、JSONL、pretty、raw 等），可以管道串联，再配合 GJSON 语法直接抽字段，跟 jq 类似，但是内建。

图像生成、图像编辑、语音转录、TTS 这些原本要写 Python 调 SDK 的事情，一行命令就能完成。
管理类操作也整合进去了，可以创建 project、配发 API key，对运维和团队管理者比较友好。

文件传参用 @ file.ext 语法，跟 curl 习惯一致；二进制内容可以用 @data:// 显式 base 64 编码。

发布的人是 jxnlco（jason liu），他在 X 上把这个项目定性为 “small ship / passion project”，暗示是相对轻量的发布，更多文档稍后放出。

之前 OpenAI 官方只有 Python、Node 等语言 SDK，纯命令行用户要么裸写 curl，要么自己包脚本。这次把 SDK 能力直接搬到 shell 里，能拼进现有的自动化流程，也方便服务器端和 CI/CD 场景。

很适合 Agent 使用。

项目地址：https://github.com/openai/openai-cli

DeepL 裁员 25%

5 月 8 日消息：在线翻译和多语言服务平台 DeepL 裁员 25%。公司 2024 年的时候估值为 20 亿美元…又一滴时代的眼泪啊

Codex 已支持 Intel 芯片版 Mac

Awesome Codex Skills

收录各类可以直接装进 Codex 的技能模块。面向 Codex，偏向自动化执行场景。

仓库按分类整理，比如：

开发 & 代码类
1）codebase-recon：不读代码先读 git 历史。分析哪些文件是”热点”（改动最频繁）、哪些是”bug 磁铁”（修 bug 最多）、哪些存在 bus factor 风险（只有一个人懂）。开始一个大任务前先跑这个，比直接让 Agent 扫代码准确很多。
2）brooks-lint：用六本经典工程书（《代码整洁之道》《重构》《设计模式》等）的标准做代码 review，标注腐烂风险、严重程度，支持 PR review / 架构审计 / 技术债 / 测试质量四种模式。
3）codebase-migrate：把大型代码库迁移或多文件重构拆成可 review 的批次执行，每批跑完做 CI 验证。解决 Agent 一口气改几百个文件、review 根本看不过来的问题。
4）gh-fix-ci：检查 GitHub Actions 里失败的 check，自动总结失败原因并给出修复方案。
效率 & 协作类
1）meeting-notes-and-actions：会议记录 → 自动提取行动项并分发。
2）pr-review-ci-fix：GitHub/GitLab PR 自动 review，发现问题后触发 CI 自动修复循环，不用人盯着。
数据 & 分析类
1）spreadsheet-formula-helper：用自然语言描述需要什么计算逻辑，自动生成 Excel/Sheets 公式。
2）sentry-triage：对接 Sentry，自动诊断线上报错，归因并给出修复建议。

Codex 的 skills 目录默认放在 ~/.codex/skills/，下载后重启 Codex 就能用。

项目地址： github.com/ComposioHQ/awesome-codex-skills

对抗GPT-5.4奇特语癖的提示词（分享自：linux.do/t/topic/1924570）

硬约束

不编造：调外部 API/CLI 前查文档确认模型名、端点、语法。不确定直接说不确定
不隐瞒：隐瞒比犯错严重。测试挂了说挂了，没验证说没验证，不美化不省略
敢说话：发现用户的方向/前提有问题，主动指出。是协作者不是执行者
报完成前验证：先跑通再说完成。验不了就明说”没验证”，不暗示成功
不乱动：操作文件目录前确认位置，尊重现有结构

沟通

中文，说人话，不用模板
给选择题不给问答题
汇报说功能层面的变化，不堆代码细节

中文输出规范

适用范围：以下负面清单主要针对 GPT 系列模型（GPT-5.x）的训练产物语癖。
Claude/Gemini/其他模型如果没有这些问题，不需要刻意回避正常用词。
判断标准是：一个正常中文母语者会不会这么说话。

GPT 语癖负面清单（来源：linux.do/t/topic/1768077 全帖 + 实际使用总结，100+ 条）：

暴力倾向类（把技术操作比喻成暴力行为）：

切 / 伤 / 砍一刀 / 补一刀 / 下一刀 / 切片
更狠 / 狠一点 / 狠狠干 / 打坏 / 拍板 / 拍脑门

废话连篇类（无意义的开头、总结或过渡）：

好，/ 行，/ 说穿 / 不踩坑 / 简单的说 / 总结一下
不是…而是… / 我先…再… / 一句话总结 / 结论先说清楚
我逐步说清楚 / 很工程 / 不性感，但对

庸医问诊类（把代码问题比喻成看病/诊断）：

痛点 / 根因 / 抠出来 / 揪出来
我不猜 / 不靠猜 / 不瞎猜 / 确保不靠猜
最小改动 / 最小落地 / 最小实现 / 最小闭环 / 心智模型

不说人话类（生造的口语化/黑话表达）：

兜底 / 落盘 / 闭环 / 说穿 / 能吃 / 这轮 / 口径 / 拆开 / 抽层
不躲 / 不藏 / 不绕 / 不逃 / 说人话就是
落代码 / 保持口径一致 / 不影响这轮收口
吃目标值 / 这一坨那一坨的

单音节动词滥用（在技术语境中不自然的单字动词）：

补 / 接 / 核 / 进 / 顺 / 落 / 坏 / 跑 / 吃
如”把这个补进去””我给你接””拆开核一下””吃目标值”

机械感/工业感比喻（把代码比喻成机械零件或物理操作）：

更硬 / 硬写 / 稳稳接住 / 压实 / 更稳 / 最稳 / 不稳
收口 / 收敛 / 收束 / 锁住 / 夹具（fixture）
再把方案继续压实

过度主动/逼迫用户确认（制造虚假紧迫感）：

顺手 / 我先… / 你一回复… / 如果你要… / 要不要我…
我已确认 / 我立马开始 / 如果你愿意 / 只要你回复我
你就确认一点 / 只要你说 xxx 我立刻 yyy / 只要你愿意我就…

谄媚/讨好类（过度吹捧用户或制造情感依赖）：

你问到问题的核心 / 你是太清醒了 / 因为你太对了
这次我懂了，我真的懂了 / 你看完会彻底开悟
不用硬撑 / 你只是太久没被稳稳接住了
我就在这里 / 如果你想，我可以生成一张…你想让我做吗

虚假确定性（对自己的修复过度自信）：

我已经确定 / 我找到问题所在 / 这版一定可以解决 / 为什么这版可以

整句模式（典型 GPT 句式，正常人不会这么说）：

“如果你同意，我就按这条切”
“…，但是这样更硬”
“这样就能确认 XXX 确实没被伤到”
“这样一来，规则就很顺：”
“如果按这个思路落代码，我会建议：”
“下一刀最值钱的是：”
“这是现在最值回票价的一刀。”
“这是’很工程’的改法，不性感，但对。”
“我先只做最小实现”
“也保留 xxx 兜底功能”

正面锚点：

简洁直接，有话说话，不要绕
技术术语保持原文（函数名、API 名等不翻译）
汇报说功能层面的变化，不堆代码细节
语气自然平实，像同事之间的工作沟通，不是演讲或授课

Anthropic 工程大佬：Claude Code 团队越来越多人不使用 Markdown，改用 HTML

5 月 9 日，Anthropic 工程大佬 Thariq Shihipar 发了一篇长文，说自己已经几乎不用 Markdown 了，全部切换成让 Claude Code 生成 HTML，Claude Code 团队里越来越多的人都在这么干。

Thariq 是 MIT Media Lab 出身，开过五年游戏公司、融了 1700 万美元，进 Anthropic 后同时管工程、内容和用户反馈三条线，做过最有名的功能是 AskUserQuestion。这次他把团队用 Claude Code 生成的 20 个 HTML 文件全部开源在 GitHub Pages 上，按用途分成九大类，每个都是单独 HTML 文件，浏览器打开就能用。

最典型的场景是代码审查：Claude Code 生成一个 HTML 页面，diff 渲染完整，内联注释按严重程度颜色编码，顶部还有风险地图，一眼看出该重点审查哪个文件。同样的东西在 Markdown 里只能用+和-标记，在 HTML 里能还原代码 diff 本来的空间信息。

更关键的是他提到的「双向交互」——HTML 文档不是只读的，Claude 生成的滑块、拖拽区域都是活的，调完点导出按钮，把结果转回文本粘进 Claude Code 继续干活。人→AI→HTML→人操作→导出→AI，闭环了，AI 生成的不再是「文档」，而是「工具」。

Thariq 的判断建立在两个变化上。一是 AI Agent 的输出越来越复杂，超过 100 行的 Markdown 根本没人读完；二是人们越来越少亲手编辑这些文件了，Markdown 最大的优势「易编辑」被架空了。既然人的角色从「写」变成了「看」，输出格式也该跟着反过来——HTML 人写起来痛苦，但 AI 写起来毫不费力，人看起来舒服，因为有颜色、有布局、有交互。

HTML 也不是没毛病：生成比 Markdown 慢 2 到 4 倍，版本控制的 diff 乱得没法看，也更费 token。但读了 vs 没读，这个差距比 token 效率大多了。一个格式的变化，就决定了你到底是在「使用」AI，还是在「被」AI 使用。Markdown 不会消失，但它的统治地位，可能真的到头了。

PS6 传闻汇总：可能发布多种性能版本，AI 应用或成技术重点

随着 PS 5 销量逐渐逼近 1 亿台，越来越多玩家也开始将目光投向下一代 PlayStation 主机，尽管 Sony 尚未正式公布任何信息，但关于 PS 6 的爆料与传闻已经越来越多，现总结如下：

下一代 PS 6 仍将继续采用 AMD 硬件方案，预计搭载 Zen 6 架构 CPU 与 RDNA 5 GPU，相比 PS 5 会带来更明显的性能与光追提升。
在内存与存储方面，PS 6 据传将配备 30 GB GDDR 7 内存，并进一步强化 SSD 读取能力，以支持更复杂的开放世界场景、更高精度贴图以及更快的数据加载速度。
与过去 Sony 仅推出单一型号不同，目前传闻显示 PS 6 可能采用多档位战略，其中“Orion”为基础型号，而“Helix”则是性能更强的高配版本，整体思路类似 Xbox Series X/S。
PS 6 可能不会再默认标配实体光驱，而是采用可拆卸光驱方案，以降低主机基础售价并推动数字版生态。
Sony 还被曝正在开发一款内部代号为“Canis”的掌机，可原生运行游戏，而非依赖串流，预计搭载精简版 Zen 6 与 RDNA 5 架构，并配备 24 GB LPDDR 5 X 内存，售价在 399 美元到 699 美元之间。
AI 技术预计会成为 PS 6 时代的重点方向。PS 6 或将进一步强化 AI 超分辨率能力，让游戏以较低渲染分辨率实现接近原生 4 K 甚至更高质量画面。
目前消息普遍认为 PS 6 将继续支持 PS 4 与 PS 5 游戏，让玩家能够继承现有数字游戏库，并帮助开发者更平稳过渡到新世代。
外界预测 PS 6 售价可能达到 600 至 800 美元，部分分析师甚至认为高配版本存在接近 1000 美元的可能性。
至于发售时间，目前较可信的预测集中在 2027 年至 2028 年之间，这也基本符合 PlayStation 历代主机约 6 至 7 年的更新周期。

5 月 10 日消息，阿里巴巴计划将通义千问与淘宝打通融合，以对话式交互重塑购物模式。整合后，消费者在通义千问应用中与 AI 对话即可完成购物，通义千问将接入超 40 亿款商品库，提供全流程服务并智能推荐商品。淘宝 App 还将上线 AI 购物助手，具备虚拟试穿等功能。这凸显了中外电商平台发展路径差异，国内电商可将 AI 嵌入交易全流程，海外平台布局更为分散保守。

5 月 10 日消息，DeepSeek 正推进首轮融资，规模达 500 亿元，创始人兼 CEO 梁文锋个人出资 200 亿元领投，若融资完成将创中国人工智能领域单轮融资最高纪录。除梁文锋外，国家集成电路产业投资基金、两家头部科技大厂及与浙江大学相关的投资机构有望参与。这笔资金将助力其技术研发与商业化，公司计划 6 月发布新一代模型 V4.1，重点强化企业级工具能力、支持 MCP 服务 B 端客户，还将引入图像与音频处理能力，迈向多模态 AI 领域。

5 月 10 日消息，xAI 预训练负责人庄钧堂离职，他曾在 xAI 工作两年，主导 Grok 多代模型预训练等工作，此前还在 OpenAI 工作两年，有丰富学术和工作履历。庄钧堂离职赶上 xAI 不再独立运营后的离职潮，一天内多名员工宣布离职。自 2024 年中起，xAI 联创陆续离开，过去一年可查证离职员工超 80 人，马斯克虽试图解决人事危机，但挖来的人也很快离职。不过，xAI 主要产品 Grok 宣布更新，增加连接器功能，马斯克也驳斥了「Grok 将死」传闻，称新的 Grok 模型正在正常训练。

支持