已有 577 人访问
许祥 ID.17128
阅读(459)
博客(0)
许祥的阅读

AI模型如何伪装“对齐”以及为何你需要关注
​​我还记得第一次看《非常嫌疑犯》的情景——这是那种只有第一次观看时才能真正享受的电影。凯文·史派西饰演的凯瑟·索泽(KeyserSöze)在整部影片中伪装成一个无害、跛脚的骗子VerbalKint,精心构建了一个不引人怀疑的伪装。直到最后那一刻,他走出警察局时跛脚慢慢消失,我们才恍然大悟:自己被彻底欺骗了。研究Claude的公司Anthropic去年末也经历了类似的“天呐”时刻——他们发现自己的
75°/ 2025-07-13/755 人阅读 / 0 人点赞 / 0 条评论

99% 的 AI 创业公司将在 2026 年前倒闭 —— 原因在这里
​​在90年代末,我还在伯克利读书,眼睁睁看着互联网泡沫像一场发烧梦一般上演。流量就是收入;在公司名后加个“.com”,投资人就会撒钱;没有商业模式的创业公司都在投超级碗广告,许多人一夜之间成了“纸上百万富翁”。我1999年在SunMicrosystems实习时,常常开车沿101号公路经过那些贴满AltaVista、Excite等公司广告牌的办公楼——这些公司后来都注定要灭亡。2001年时,这些大
87°/ 2025-07-13/875 人阅读 / 1 人点赞 / 0 条评论

试用AI智能体:通过Zapier MCP、Goose和CursorAI发送Mailinator邮件
​​最近在领英(LinkedIn)上获悉,工作流自动化专家Zapier也加入了MCP的行列,并决定通过MCP的方式提供其所有的集成功能。感谢Angie的及时提醒。这将使AI智能体能够与这些集成功能进行交互,也为像我这样的人(略懂技术但非专业开发者)带来了很多实验机会,让我们能够更多地了解这项不断发展的技术。AngieJones在领英上的帖子,是我第一次听说ZapierMCP服务器。​​以下是我进行
100°/ 2025-06-14/1001 人阅读 / 0 人点赞 / 0 条评论

测试人员专用AI提示词库
研习提示词工程(资源)已有时日,现结合实践经验整理出一套优化测试任务的提示词列表。以下是精心整理的提示词列表。请注意,这些是为获得详细输出和清晰结果而创建的通用提示词。可以根据项目背景和需求自由调整这些提示词。如果你想学习构建优秀提示词的技巧,请参考《面向测试人员的提示词清单》。📌重要说明:本词库将随实验进展持续更新优化,建议收藏页面获取最新版本。预祝您的测试智能化探索愉快!需求分析1、需求分析
204°/ 2025-06-14/2042 人阅读 / 4 人点赞 / 0 条评论

测试 AI 编码的应用程序:挑战与建议
像Lovable.dev这样的AI工具正在改变应用开发模式,它们能通过自然语言提示快速生成原型,让每个人都能轻松创建功能性应用。这些工具的编码速度比传统开发人员快20倍,但也带来了在测试、调试和维护生成代码方面的独特挑战。当团队引入AI时,必须保持警惕。​​我们下面将探讨一些挑战,以及在测试和识别问题时可能遇到的常见场景。如果你希望将这些代码作为项目的基础模板,并在未来扩展产品,请不要在测试之前就
91°/ 2025-06-14/916 人阅读 / 0 人点赞 / 0 条评论

探索 AI 工具及其应用
​​学习这件事,似乎真的永无止境。近我还挺享受不断尝试各种新工具的过程,并努力在脑海中梳理它们的逻辑。从战略角度,我希望能清晰阐述AI如何支持质量工程领域,尤其是测试自动化方向。​​以下是我这周尝试的一些工具和体验:1.Anthropic’sClaude:计算机交互实验我重新回顾了最初用Claude进行计算器功能的实验(详见领英动态:链接),并尝试通过其Beta功能深入学习。尽管此前从未在本地使用
62°/ 2025-06-14/622 人阅读 / 0 人点赞 / 0 条评论

引入 Feather Wand Agent:AI 驱动的一体化性能测试工具包
在当今节奏飞快的软件开发世界中,系统性能不再是可选项,而是刚需。像JMeter、k6、Gatling和Locust这些工具早已是负载测试的行业标准,但每个工具都有不同的界面、配置方式和学习曲线。管理它们往往既复杂又耗时。现在,FeatherWandAgent解决了这一痛点。这是一个由人工智能驱动的工具包,将这四大性能测试工具整合进一个智能对话式界面,大大简化了测试流程。本文将带你深入了解Feath
161°/ 2025-06-14/1614 人阅读 / 0 人点赞 / 0 条评论

两小时内创建一个 AI 辅助的测试框架
​​我相信博客文章应由人类撰写,所以这篇“不够完美”的技术随笔完全出自我手,而不是AI所为。另外,我不会接受任何新工具的评测请求,只会写我感兴趣的内容,请不要联系我!在上一篇文章中,我介绍了自己最近亲自尝试的一些AI工具。特别是Napkin.ai,这是一个我已经多次回访、节省时间的应用,未来我可能还会继续使用它。这周,我的注意力被一些其他工具吸引了:Cursor:一个以AI为核心的集成开发环境(I
78°/ 2025-06-14/780 人阅读 / 1 人点赞 / 0 条评论

AI 看起来很聪明,但它能判断对错吗?——一场高风险的人机对决测试正在展开
​​如今的人工智能,尤其是那些超级强大的模型,如GPT-4、Claude和Gemini,早已不仅仅是玩玩游戏、写写诗了。它们正快速进入社会中最关键的位置。想象一下:AI正在帮助医生诊断疾病,协助银行判断谁可以贷款,协助平台识别假新闻,参与企业招聘,甚至操控自动驾驶车辆。它带来的潜力巨大——超高速分析、一致性决策、甚至可能超越人类固有偏见。它可以在几秒内查阅成千上万份病历,或识别出人类可能忽视的金融
95°/ 2025-06-14/959 人阅读 / 0 人点赞 / 0 条评论

设计易于测试的软件
为何测试驱动的设计自然带来更优代码​​在我多年的培训经验中,我发现了一个有趣的现象:当开发人员以测试性为设计考量时,他们往往能打造出更优质的代码架构,即便他们并未刻意遵循特定的设计模式。提及软件测试,许多开发人员常常流露出无奈之情,尤其是单元测试,似乎只是被迫完成的任务。然而,在培训众多工程师后,我观察到,当我们将测试性融入代码设计时,不仅测试工作变得轻松,代码本身的质量也会显著提升。这并非偶然巧
68°/ 2025-06-14/687 人阅读 / 0 人点赞 / 0 条评论