许祥的空间

已有 577 人访问

许祥 ID.17128

阅读(459)

博客(0)

许祥的阅读

AI模型如何伪装“对齐”以及为何你需要关注

我还记得第一次看《非常嫌疑犯》的情景——这是那种只有第一次观看时才能真正享受的电影。凯文·史派西饰演的凯瑟·索泽（KeyserSöze）在整部影片中伪装成一个无害、跛脚的骗子VerbalKint，精心构建了一个不引人怀疑的伪装。直到最后那一刻，他走出警察局时跛脚慢慢消失，我们才恍然大悟：自己被彻底欺骗了。研究Claude的公司Anthropic去年末也经历了类似的“天呐”时刻——他们发现自己的

75°/ 2025-07-13/755 人阅读 / 0 人点赞 / 0 条评论

99% 的 AI 创业公司将在 2026 年前倒闭 —— 原因在这里

在90年代末，我还在伯克利读书，眼睁睁看着互联网泡沫像一场发烧梦一般上演。流量就是收入；在公司名后加个“.com”，投资人就会撒钱；没有商业模式的创业公司都在投超级碗广告，许多人一夜之间成了“纸上百万富翁”。我1999年在SunMicrosystems实习时，常常开车沿101号公路经过那些贴满AltaVista、Excite等公司广告牌的办公楼——这些公司后来都注定要灭亡。2001年时，这些大

87°/ 2025-07-13/875 人阅读 / 1 人点赞 / 0 条评论

试用AI智能体：通过Zapier MCP、Goose和CursorAI发送Mailinator邮件

最近在领英（LinkedIn）上获悉，工作流自动化专家Zapier也加入了MCP的行列，并决定通过MCP的方式提供其所有的集成功能。感谢Angie的及时提醒。这将使AI智能体能够与这些集成功能进行交互，也为像我这样的人（略懂技术但非专业开发者）带来了很多实验机会，让我们能够更多地了解这项不断发展的技术。AngieJones在领英上的帖子，是我第一次听说ZapierMCP服务器。以下是我进行

100°/ 2025-06-14/1001 人阅读 / 0 人点赞 / 0 条评论

测试人员专用AI提示词库

研习提示词工程（资源）已有时日，现结合实践经验整理出一套优化测试任务的提示词列表。以下是精心整理的提示词列表。请注意，这些是为获得详细输出和清晰结果而创建的通用提示词。可以根据项目背景和需求自由调整这些提示词。如果你想学习构建优秀提示词的技巧，请参考《面向测试人员的提示词清单》。📌重要说明：本词库将随实验进展持续更新优化，建议收藏页面获取最新版本。预祝您的测试智能化探索愉快！需求分析1、需求分析

204°/ 2025-06-14/2042 人阅读 / 4 人点赞 / 0 条评论

测试 AI 编码的应用程序：挑战与建议

像Lovable.dev这样的AI工具正在改变应用开发模式，它们能通过自然语言提示快速生成原型，让每个人都能轻松创建功能性应用。这些工具的编码速度比传统开发人员快20倍，但也带来了在测试、调试和维护生成代码方面的独特挑战。当团队引入AI时，必须保持警惕。我们下面将探讨一些挑战，以及在测试和识别问题时可能遇到的常见场景。如果你希望将这些代码作为项目的基础模板，并在未来扩展产品，请不要在测试之前就

91°/ 2025-06-14/916 人阅读 / 0 人点赞 / 0 条评论

探索 AI 工具及其应用

学习这件事，似乎真的永无止境。近我还挺享受不断尝试各种新工具的过程，并努力在脑海中梳理它们的逻辑。从战略角度，我希望能清晰阐述AI如何支持质量工程领域，尤其是测试自动化方向。以下是我这周尝试的一些工具和体验：1.Anthropic’sClaude：计算机交互实验我重新回顾了最初用Claude进行计算器功能的实验（详见领英动态：链接），并尝试通过其Beta功能深入学习。尽管此前从未在本地使用

62°/ 2025-06-14/622 人阅读 / 0 人点赞 / 0 条评论

引入 Feather Wand Agent：AI 驱动的一体化性能测试工具包

在当今节奏飞快的软件开发世界中，系统性能不再是可选项，而是刚需。像JMeter、k6、Gatling和Locust这些工具早已是负载测试的行业标准，但每个工具都有不同的界面、配置方式和学习曲线。管理它们往往既复杂又耗时。现在，FeatherWandAgent解决了这一痛点。这是一个由人工智能驱动的工具包，将这四大性能测试工具整合进一个智能对话式界面，大大简化了测试流程。本文将带你深入了解Feath

161°/ 2025-06-14/1614 人阅读 / 0 人点赞 / 0 条评论

两小时内创建一个 AI 辅助的测试框架

我相信博客文章应由人类撰写，所以这篇“不够完美”的技术随笔完全出自我手，而不是AI所为。另外，我不会接受任何新工具的评测请求，只会写我感兴趣的内容，请不要联系我！在上一篇文章中，我介绍了自己最近亲自尝试的一些AI工具。特别是Napkin.ai，这是一个我已经多次回访、节省时间的应用，未来我可能还会继续使用它。这周，我的注意力被一些其他工具吸引了：Cursor：一个以AI为核心的集成开发环境（I

78°/ 2025-06-14/780 人阅读 / 1 人点赞 / 0 条评论

AI 看起来很聪明，但它能判断对错吗？——一场高风险的人机对决测试正在展开

如今的人工智能，尤其是那些超级强大的模型，如GPT-4、Claude和Gemini，早已不仅仅是玩玩游戏、写写诗了。它们正快速进入社会中最关键的位置。想象一下：AI正在帮助医生诊断疾病，协助银行判断谁可以贷款，协助平台识别假新闻，参与企业招聘，甚至操控自动驾驶车辆。它带来的潜力巨大——超高速分析、一致性决策、甚至可能超越人类固有偏见。它可以在几秒内查阅成千上万份病历，或识别出人类可能忽视的金融

95°/ 2025-06-14/959 人阅读 / 0 人点赞 / 0 条评论

设计易于测试的软件

为何测试驱动的设计自然带来更优代码在我多年的培训经验中，我发现了一个有趣的现象：当开发人员以测试性为设计考量时，他们往往能打造出更优质的代码架构，即便他们并未刻意遵循特定的设计模式。提及软件测试，许多开发人员常常流露出无奈之情，尤其是单元测试，似乎只是被迫完成的任务。然而，在培训众多工程师后，我观察到，当我们将测试性融入代码设计时，不仅测试工作变得轻松，代码本身的质量也会显著提升。这并非偶然巧

68°/ 2025-06-14/687 人阅读 / 0 人点赞 / 0 条评论

首页
4
5
6
7
8
尾页