哪个框架才是真正能“拯救”你的AI项目?核心要点CRISP-DM已过时。Agile本身不够用。TDSP虽然流程好但绑定厂商。CPMAI是新兴选手。MLOps必不可少但不是万能钥匙。欢迎来到你的AI项目生存秘籍。1.为什么你的AI项目注定失败(以及该怎么做)AI已经不再是研究机构的专属,它已成为现代企业战略的核心。但现实是:近一半的AI项目未能创造真正的价值。为什么?因为大多数团队还在用传统软件
在研究自主代理及其背后的LLM(大型语言模型)时,我一直对文章和技术论文中频繁提及的基准测试充满好奇。虽然我很快就能理解模型开放性的重要性(我对此极为坚定),但我仍需要更清晰地了解这些基准测试实际测量的内容,以及如何正确解读它们的结果。我想,如果我都在努力搞懂这些基准测试,可能其他人也有同样的困惑。下面是我目前为止了解到的LLM基准测试生态,以及为什么最终:“开放性”可能比任何性能分数都更重要。为
欢迎回来!今天我们来聊点新的。这是一个新鲜的概念,甚至带点未来感。我自己也在试验它。我称之为“LLM理事会(CouncilofLLMs)”。这个新颖的想法可能会从根本上改变我们在工作和测试中头脑风暴、制定策略、生成关键想法及其优化的方式。什么是“LLM理事会”?想象一个值得信赖的顾问团,总是随时待命、保持警觉。里面有各种各样的智慧,每个成员都能提供独特的见解,帮助你解决难题。但这个“理事会”不是由
我最近正在通过MinistryofTesting推出的30天AI测试挑战(30DaysofAIinTestingChallenge)学习AI在测试领域的应用。这个备忘单就是我与另一位挑战参与者、出色的测试人员JoyzNg一起合作的成果。我们结合了对提示词工程(PromptEngineering)的学习、各种提示技巧以及我们自己使用AI大语言模型(LLMs)时的实际经验,共同总结出这份清单,帮助测试
想象你雇佣了一位专家,却从不告诉他你需要什么。最好的结果是得到一些随机建议,最坏的情况则是一团糟。在AI的世界里,“系统提示词(SystemPrompt)”就像是这份“职位描述”——它是每条用户指令之上的元指令,定义AI的人格、范围、规则和风格,在AI“听”到用户之前就已设定好。用户提示词(UserPrompt):处理即时请求,如“翻译这段”、“讲个笑话”、“修复我的SQL”。系统提示词(Sy
这是一个旨在帮助软件测试人员根据任务复杂度和输出质量需求选择合适大语言模型(LLM)的实用指南。文中提到的图表将测试任务按“推理深度”与“输出质量”两个维度划分为四个象限,每个象限中都列出了适用的AI模型图标以及对应的测试活动,例如生成测试数据、头脑风暴、编写自动化代码和设计全面测试策略等。🔍为什么要选对AI模型?市面上的AI模型五花八门:有的免费有的响应快有的则拥有深度洞察力,对测试人员至
每个传奇都需要它的“大师之剑”——那把将潜力转化为力量的关键神器。在实现企业AI自主化的征途中,我们已经收集了各种组件,组建了工具箱,但一直缺失一样关键的东西。就像林克没有标志性圣剑就去面对盖侬,我们的代理式AI(AgenticAI)愿景也一直缺少一把真正能在大规模落地中大放异彩的武器:高效的分布式推理能力。在《AgentOps时代》中,我曾谈到未来的自主基础设施将像生物体一样运作——自我维持
我还记得第一次看《非常嫌疑犯》的情景——这是那种只有第一次观看时才能真正享受的电影。凯文·史派西饰演的凯瑟·索泽(KeyserSöze)在整部影片中伪装成一个无害、跛脚的骗子VerbalKint,精心构建了一个不引人怀疑的伪装。直到最后那一刻,他走出警察局时跛脚慢慢消失,我们才恍然大悟:自己被彻底欺骗了。研究Claude的公司Anthropic去年末也经历了类似的“天呐”时刻——他们发现自己的
在90年代末,我还在伯克利读书,眼睁睁看着互联网泡沫像一场发烧梦一般上演。流量就是收入;在公司名后加个“.com”,投资人就会撒钱;没有商业模式的创业公司都在投超级碗广告,许多人一夜之间成了“纸上百万富翁”。我1999年在SunMicrosystems实习时,常常开车沿101号公路经过那些贴满AltaVista、Excite等公司广告牌的办公楼——这些公司后来都注定要灭亡。2001年时,这些大
最近在领英(LinkedIn)上获悉,工作流自动化专家Zapier也加入了MCP的行列,并决定通过MCP的方式提供其所有的集成功能。感谢Angie的及时提醒。这将使AI智能体能够与这些集成功能进行交互,也为像我这样的人(略懂技术但非专业开发者)带来了很多实验机会,让我们能够更多地了解这项不断发展的技术。AngieJones在领英上的帖子,是我第一次听说ZapierMCP服务器。以下是我进行