2026年5月 宝藏资料丨每日分享

2026-05-11

网络安全面试题大全

github.com/duckpigdog/Sec-Interview/


AI 辅助写小说的新做法

AI 辅助写小说的新做法:给每个主要角色单独建一个 AI 智能体。每写一章前,先让 AI 把每个角色当下的认知状态和压力状态过一遍,再决定他这一章去找谁、说什么、做什么。


开源 Harness Engineering 教程

Learn Harness Engineering 是一门专注于 AI 编程智能体工程化落地的课程

项目地址:https://walkinglabs.github.io/learn-harness-engineering/zh/


电子书看书的 1-2-3 法则

  1. 就是只用一个看书软件,一般是 KOReader,其它软件都删掉。
  2. 就是只放两本电子书,不要放更多,看完其中一本删掉,换新的。
  3. 就是三章不弃原则。当然有可能雄心壮志太大没准备好,看不下去。但是原则是书看前三章,三章之内绝不弃坑。

秉持 1-2-3 法则就能最大化电子书的阅读效率,实际上也就最大化了时间利用率


Anthropic 发布 Claude Office 365 套件

AI 竞争正在从“聊天机器人能力”,进入“谁能接管真实工作流”。

Anthropic 把 Claude 全面塞进了 Microsoft 365。Excel、PowerPoint、Word 三个插件从 beta 转为正式版(GA),Outlook 插件同步进入公测。

意味着不用再切到 claude 网页端,可以在 Excel 表格里、PPT 幻灯片上、Word 文档中、Outlook 邮箱里直接喊 Claude 干活。

真正的卖点是跨应用的上下文衔接。Anthropic 给的典型场景:先在 Outlook 里让 Claude 整理收件箱、起草回复,顺手打开邮件里附的 brief 到 Word;接着让它根据 Word 简报在 Excel 里搭财务模型,公式分布在多个 sheet;再做成 PowerPoint,最后回到 Outlook 起草评审邀请。整个流程里 Claude 带着前一步的上下文走,不需要重新喂材料。

具体能力上,Excel 里 Claude 能改单元格和假设条件而不破坏现有公式;PowerPoint 里它按你的模板排版,生成原生图表而不是塞图片;Word 里改稿用 tracked changes(修订模式)呈现,让你逐条接受或拒绝;Outlook 里草稿会停在草稿箱等你点发送。

定价方面,所有付费 Claude 套餐用户都能用,不需要额外掏钱。

视频地址:http://t.cn/AXJ1qIfc

使用地址:https://claude.com/claude-for-microsoft-365


OpenAI 给 Codex 推出了 Chrome 扩展,让它能直接在浏览器里干活

Mac 和 Windows 用户从今天起可以在 Codex app 里安装 Chrome 插件,让 Codex 直接在浏览器里执行任务,并且支持后台多标签并行运行,不会霸占你正在用的浏览器界面。

Codex 是 OpenAI 的编程 agent,之前主要活动范围是终端、IDE 和云端。这次进入浏览器后,它能处理那些必须登录才能完成的活儿,比如查内部后台、刷 dashboard、在 CRM 里更新客户信息、走完需要点好几个页面才能完成的复杂表单流程。

工作方式上,Codex 通过写代码、跑代码来操作页面。一个任务如果涉及多个工具,它会自己挑:能用现成插件搞定就用插件,必须登录的网站就走 Chrome,需要时两边混着来。

OpenAI 给出的典型用例包括调试浏览器里的业务流程、做调研、更新 CRM 记录、处理结构化页面里的重复数据录入。

今天就能在 Codex app 里启用,欧盟和英国暂未开放,OpenAI 表示后续支持。

视频 1:http://t.cn/AXJ1q88g
视频 2:http://t.cn/AXJ1q8RP
视频 3:http://t.cn/AXJ1q8RG


OpenAI 上线了官方命令行工具 openai-cli,开发者可以直接在终端里调 API,不用再写 SDK 代码

项目开源在 GitHub (openai/openai-cli),Apache 2.0 协议,可通过 Homebrew 或 Go 安装。命令走资源化结构,比如 openai responses create –input “…” –model 这样的写法。

工具的几个核心能力:

调用 Responses API,并且支持所有 cloud tools,也就是 OpenAI 托管的内置工具,包括 web 搜索、代码解释器、文件检索、图像生成等。换句话说,agent 风格的工作流也能直接从命令行跑通。

输出走 Unix 风格的结构化格式(JSON、YAML、JSONL、pretty、raw 等),可以管道串联,再配合 GJSON 语法直接抽字段,跟 jq 类似,但是内建。

图像生成、图像编辑、语音转录、TTS 这些原本要写 Python 调 SDK 的事情,一行命令就能完成。
管理类操作也整合进去了,可以创建 project、配发 API key,对运维和团队管理者比较友好。

文件传参用 @ file.ext 语法,跟 curl 习惯一致;二进制内容可以用 @data:// 显式 base 64 编码。

发布的人是 jxnlco(jason liu),他在 X 上把这个项目定性为 “small ship / passion project”,暗示是相对轻量的发布,更多文档稍后放出。

之前 OpenAI 官方只有 Python、Node 等语言 SDK,纯命令行用户要么裸写 curl,要么自己包脚本。这次把 SDK 能力直接搬到 shell 里,能拼进现有的自动化流程,也方便服务器端和 CI/CD 场景。

很适合 Agent 使用。

项目地址:https://github.com/openai/openai-cli

DeepL 裁员 25%

5 月 8 日消息:在线翻译和多语言服务平台 DeepL 裁员 25%。公司 2024 年的时候估值为 20 亿美元…又一滴时代的眼泪啊 ​​​


Codex 已支持 Intel 芯片版 Mac ​​​


Awesome Codex Skills

收录各类可以直接装进 Codex 的技能模块。面向 Codex,偏向自动化执行场景。

仓库按分类整理,比如:

  1. 开发 & 代码类
    1)codebase-recon:不读代码先读 git 历史。分析哪些文件是”热点”(改动最频繁)、哪些是”bug 磁铁”(修 bug 最多)、哪些存在 bus factor 风险(只有一个人懂)。开始一个大任务前先跑这个,比直接让 Agent 扫代码准确很多。
    2)brooks-lint:用六本经典工程书(《代码整洁之道》《重构》《设计模式》等)的标准做代码 review,标注腐烂风险、严重程度,支持 PR review / 架构审计 / 技术债 / 测试质量四种模式。
    3)codebase-migrate:把大型代码库迁移或多文件重构拆成可 review 的批次执行,每批跑完做 CI 验证。解决 Agent 一口气改几百个文件、review 根本看不过来的问题。
    4)gh-fix-ci:检查 GitHub Actions 里失败的 check,自动总结失败原因并给出修复方案。
  2. 效率 & 协作类
    1)meeting-notes-and-actions:会议记录 → 自动提取行动项并分发。
    2)pr-review-ci-fix:GitHub/GitLab PR 自动 review,发现问题后触发 CI 自动修复循环,不用人盯着。
  3. 数据 & 分析类
    1)spreadsheet-formula-helper:用自然语言描述需要什么计算逻辑,自动生成 Excel/Sheets 公式。
    2)sentry-triage:对接 Sentry,自动诊断线上报错,归因并给出修复建议。

Codex 的 skills 目录默认放在 ~/.codex/skills/,下载后重启 Codex 就能用。

项目地址: github.com/ComposioHQ/awesome-codex-skills


对抗GPT-5.4奇特语癖的提示词(分享自:linux.do/t/topic/1924570)

硬约束

  • 不编造:调外部 API/CLI 前查文档确认模型名、端点、语法。不确定直接说不确定
  • 不隐瞒:隐瞒比犯错严重。测试挂了说挂了,没验证说没验证,不美化不省略
  • 敢说话:发现用户的方向/前提有问题,主动指出。是协作者不是执行者
  • 报完成前验证:先跑通再说完成。验不了就明说”没验证”,不暗示成功
  • 不乱动:操作文件目录前确认位置,尊重现有结构

沟通

  • 中文,说人话,不用模板
  • 给选择题不给问答题
  • 汇报说功能层面的变化,不堆代码细节

中文输出规范

适用范围:以下负面清单主要针对 GPT 系列模型(GPT-5.x)的训练产物语癖。
Claude/Gemini/其他模型如果没有这些问题,不需要刻意回避正常用词。
判断标准是:一个正常中文母语者会不会这么说话。

GPT 语癖负面清单(来源:linux.do/t/topic/1768077 全帖 + 实际使用总结,100+ 条):

暴力倾向类(把技术操作比喻成暴力行为):

  • 切 / 伤 / 砍一刀 / 补一刀 / 下一刀 / 切片
  • 更狠 / 狠一点 / 狠狠干 / 打坏 / 拍板 / 拍脑门

废话连篇类(无意义的开头、总结或过渡):

  • 好,/ 行,/ 说穿 / 不踩坑 / 简单的说 / 总结一下
  • 不是…而是… / 我先…再… / 一句话总结 / 结论先说清楚
  • 我逐步说清楚 / 很工程 / 不性感,但对

庸医问诊类(把代码问题比喻成看病/诊断):

  • 痛点 / 根因 / 抠出来 / 揪出来
  • 我不猜 / 不靠猜 / 不瞎猜 / 确保不靠猜
  • 最小改动 / 最小落地 / 最小实现 / 最小闭环 / 心智模型

不说人话类(生造的口语化/黑话表达):

  • 兜底 / 落盘 / 闭环 / 说穿 / 能吃 / 这轮 / 口径 / 拆开 / 抽层
  • 不躲 / 不藏 / 不绕 / 不逃 / 说人话就是
  • 落代码 / 保持口径一致 / 不影响这轮收口
  • 吃目标值 / 这一坨那一坨的

单音节动词滥用(在技术语境中不自然的单字动词):

  • 补 / 接 / 核 / 进 / 顺 / 落 / 坏 / 跑 / 吃
  • 如”把这个补进去””我给你接””拆开核一下””吃目标值”

机械感/工业感比喻(把代码比喻成机械零件或物理操作):

  • 更硬 / 硬写 / 稳稳接住 / 压实 / 更稳 / 最稳 / 不稳
  • 收口 / 收敛 / 收束 / 锁住 / 夹具(fixture)
  • 再把方案继续压实

过度主动/逼迫用户确认(制造虚假紧迫感):

  • 顺手 / 我先… / 你一回复… / 如果你要… / 要不要我…
  • 我已确认 / 我立马开始 / 如果你愿意 / 只要你回复我
  • 你就确认一点 / 只要你说 xxx 我立刻 yyy / 只要你愿意我就…

谄媚/讨好类(过度吹捧用户或制造情感依赖):

  • 你问到问题的核心 / 你是太清醒了 / 因为你太对了
  • 这次我懂了,我真的懂了 / 你看完会彻底开悟
  • 不用硬撑 / 你只是太久没被稳稳接住了
  • 我就在这里 / 如果你想,我可以生成一张…你想让我做吗

虚假确定性(对自己的修复过度自信):

  • 我已经确定 / 我找到问题所在 / 这版一定可以解决 / 为什么这版可以

整句模式(典型 GPT 句式,正常人不会这么说):

  • “如果你同意,我就按这条切”
  • “…,但是这样更硬”
  • “这样就能确认 XXX 确实没被伤到”
  • “这样一来,规则就很顺:”
  • “如果按这个思路落代码,我会建议:”
  • “下一刀最值钱的是:”
  • “这是现在最值回票价的一刀。”
  • “这是’很工程’的改法,不性感,但对。”
  • “我先只做最小实现”
  • “也保留 xxx 兜底功能”

正面锚点:

  • 简洁直接,有话说话,不要绕
  • 技术术语保持原文(函数名、API 名等不翻译)
  • 汇报说功能层面的变化,不堆代码细节
  • 语气自然平实,像同事之间的工作沟通,不是演讲或授课

Anthropic 工程大佬:Claude Code 团队越来越多人不使用 Markdown,改用 HTML

5 月 9 日,Anthropic 工程大佬 Thariq Shihipar 发了一篇长文,说自己已经几乎不用 Markdown 了,全部切换成让 Claude Code 生成 HTML,Claude Code 团队里越来越多的人都在这么干。

Thariq 是 MIT Media Lab 出身,开过五年游戏公司、融了 1700 万美元,进 Anthropic 后同时管工程、内容和用户反馈三条线,做过最有名的功能是 AskUserQuestion。这次他把团队用 Claude Code 生成的 20 个 HTML 文件全部开源在 GitHub Pages 上,按用途分成九大类,每个都是单独 HTML 文件,浏览器打开就能用。

最典型的场景是代码审查:Claude Code 生成一个 HTML 页面,diff 渲染完整,内联注释按严重程度颜色编码,顶部还有风险地图,一眼看出该重点审查哪个文件。同样的东西在 Markdown 里只能用+和-标记,在 HTML 里能还原代码 diff 本来的空间信息。

更关键的是他提到的「双向交互」——HTML 文档不是只读的,Claude 生成的滑块、拖拽区域都是活的,调完点导出按钮,把结果转回文本粘进 Claude Code 继续干活。人→AI→HTML→人操作→导出→AI,闭环了,AI 生成的不再是「文档」,而是「工具」。

Thariq 的判断建立在两个变化上。一是 AI Agent 的输出越来越复杂,超过 100 行的 Markdown 根本没人读完;二是人们越来越少亲手编辑这些文件了,Markdown 最大的优势「易编辑」被架空了。既然人的角色从「写」变成了「看」,输出格式也该跟着反过来——HTML 人写起来痛苦,但 AI 写起来毫不费力,人看起来舒服,因为有颜色、有布局、有交互。

HTML 也不是没毛病:生成比 Markdown 慢 2 到 4 倍,版本控制的 diff 乱得没法看,也更费 token。但读了 vs 没读,这个差距比 token 效率大多了。一个格式的变化,就决定了你到底是在「使用」AI,还是在「被」AI 使用。Markdown 不会消失,但它的统治地位,可能真的到头了。


PS6 传闻汇总:可能发布多种性能版本,AI 应用或成技术重点

随着 PS 5 销量逐渐逼近 1 亿台,越来越多玩家也开始将目光投向下一代 PlayStation 主机,尽管 Sony 尚未正式公布任何信息,但关于 PS 6 的爆料与传闻已经越来越多,现总结如下:

  1. 下一代 PS 6 仍将继续采用 AMD 硬件方案,预计搭载 Zen 6 架构 CPU 与 RDNA 5 GPU,相比 PS 5 会带来更明显的性能与光追提升。
  2. 在内存与存储方面,PS 6 据传将配备 30 GB GDDR 7 内存,并进一步强化 SSD 读取能力,以支持更复杂的开放世界场景、更高精度贴图以及更快的数据加载速度。
  3. 与过去 Sony 仅推出单一型号不同,目前传闻显示 PS 6 可能采用多档位战略,其中“Orion”为基础型号,而“Helix”则是性能更强的高配版本,整体思路类似 Xbox Series X/S。
  4. PS 6 可能不会再默认标配实体光驱,而是采用可拆卸光驱方案,以降低主机基础售价并推动数字版生态。
  5. Sony 还被曝正在开发一款内部代号为“Canis”的掌机,可原生运行游戏,而非依赖串流,预计搭载精简版 Zen 6 与 RDNA 5 架构,并配备 24 GB LPDDR 5 X 内存,售价在 399 美元到 699 美元之间。
  6. AI 技术预计会成为 PS 6 时代的重点方向。PS 6 或将进一步强化 AI 超分辨率能力,让游戏以较低渲染分辨率实现接近原生 4 K 甚至更高质量画面。
  7. 目前消息普遍认为 PS 6 将继续支持 PS 4 与 PS 5 游戏,让玩家能够继承现有数字游戏库,并帮助开发者更平稳过渡到新世代。
  8. 外界预测 PS 6 售价可能达到 600 至 800 美元,部分分析师甚至认为高配版本存在接近 1000 美元的可能性。
  9. 至于发售时间,目前较可信的预测集中在 2027 年至 2028 年之间,这也基本符合 PlayStation 历代主机约 6 至 7 年的更新周期。

5 月 10 日消息,阿里巴巴计划将通义千问与淘宝打通融合,以对话式交互重塑购物模式。整合后,消费者在通义千问应用中与 AI 对话即可完成购物,通义千问将接入超 40 亿款商品库,提供全流程服务并智能推荐商品。淘宝 App 还将上线 AI 购物助手,具备虚拟试穿等功能。这凸显了中外电商平台发展路径差异,国内电商可将 AI 嵌入交易全流程,海外平台布局更为分散保守。


5 月 10 日消息,DeepSeek 正推进首轮融资,规模达 500 亿元,创始人兼 CEO 梁文锋个人出资 200 亿元领投,若融资完成将创中国人工智能领域单轮融资最高纪录。除梁文锋外,国家集成电路产业投资基金、两家头部科技大厂及与浙江大学相关的投资机构有望参与。这笔资金将助力其技术研发与商业化,公司计划 6 月发布新一代模型 V4.1,重点强化企业级工具能力、支持 MCP 服务 B 端客户,还将引入图像与音频处理能力,迈向多模态 AI 领域。


5 月 10 日消息,xAI 预训练负责人庄钧堂离职,他曾在 xAI 工作两年,主导 Grok 多代模型预训练等工作,此前还在 OpenAI 工作两年,有丰富学术和工作履历。庄钧堂离职赶上 xAI 不再独立运营后的离职潮,一天内多名员工宣布离职。自 2024 年中起,xAI 联创陆续离开,过去一年可查证离职员工超 80 人,马斯克虽试图解决人事危机,但挖来的人也很快离职。不过,xAI 主要产品 Grok 宣布更新,增加连接器功能,马斯克也驳斥了「Grok 将死」传闻,称新的 Grok 模型正在正常训练。

JameCling
JameCling