Posts for: #AI

AI 陷阱

用 AI 帮助思考。这是 AI 越来越聪明之后,我最主要的用法。至于效果,前段时间,我和同事们交流,我略带兴奋地告诉他们:我觉得我变聪明了。

但是我也观察到有人掉进陷阱,主要有这么几种情况:

1. 一句话询问。把 AI 当成可以理解语义的搜索引擎。

2. 只用 AI 解决问题。忘记了我们有丰富的工具。

3. 问过当作已消化吸收。比如 AI 做的 Deep Research 报告,我猜很多人只是快速扫一眼,就“放着以后看“,实际上永远不看了。

昨天合伙人 Shotgun 在公司的知识星球里发了篇文章——大语言模型说:我可以提供“高质量的回答“,前提是有“高质量的问题“。他举了好些例子帮助理解:

 原则:

 - 原则一:第一次提问要尽可能开放,只说需求,不说具体解决方案。

 - 原则二:通过问题链,通过学习大语言模型的回答,让自己的提问越来越专业,越来越细致,从而得到更高水平的答案。

 - 原则三:通过事实检查和双重检查,核实推理过程和回答的准确性。

 原因:

 - 大语言模型,我理解其本质是一个预测器:根据用户输入的内容,来从概率上预测随后的内容,由于通用的大语言模型使用大量的文本进行训练,文本质量良莠不齐,所以输出内容质量非常依赖于输入的内容质量,用户输入的内容越专业、越准确,大语言模型预测出来的内容就越“聪明“。

 - 反驳或者让大语言模型重新认真构造答案,本质上是给之前的普通回答进行降权,而给专业回答进行提权,类似于对大语言模型说:“我不希望你用一些科普的东西糊弄我,我希望看到专业的回答”、“你是一名通讯行业的专家,从你专业的角度来看:”,这时大语言模型检索的重点就会进入专业领域,而非科普,当然就更容易得到高质量的回答。

 - 问题链则是更精确进入专业领域的方式,通过提问-学习-再次追问的模式,由提问者和大语言模型共同思考、讨论,来得出更高质量的答案。

 - 问题链能起作用的另一个原因是:很多复杂问题并不存在现成的答案,虽然推理模型一定程度上,也可以组合内容来得到复杂问题的答案,但如果通过分解问题来让提问跟现存的答案更接近,显然可以提高回答的速度和质量。

祝你能在 AI 的帮助下变得更聪明。

当 AI 开始使用工具 - Manus 随感

  1. 看到 Manus 演示之后,AI + 电脑 + 权限,AI 开始使用工具——走出了从猿到人的这一步。而且相较 Devin、OpenHands 这些产品,他们做得更简单,一下子让 Agent 易于理解了。虽然我本来就用过 OpenAI 的 Deep Research、Operator,还是觉得有突破。

  2. Manus 的完成度很高,而不仅仅是粗糙的 MVP——可能也是因为此前 Monica 做了很多扎实的积累。举一个有助于传播的产品设计例子:学习了 DeepSeek,把思维链、操作链放出来了——以及最后的结果。所以每一次执行,都能有传播可能性。再举个技术的例子:他们的图像搜索做得也不错(相比之下,很多知识库产品的图像理解、搜索都有问题)。

  3. 我还挺喜欢比如即刻这家公司(他们还有小宇宙),或者 Monica 这家公司(他们还发布了 Manus),他们怎么创新的?我们怎么才能从机制上、精神上有创新?

  4. 我的第一反应是羡慕,或许还有一点点小嫉妒。Manus 离我们更近,我们似乎也能做,但为什么不是我们?什么限制了我们?导火索之一就是 Manus。我们如果想要有一个什么事情是全国第一,全球第一的话,应该是什么?我们缺了什么?想象力?野心?基础能力?算力?资金?热情?全力以赴?年轻?

  5. 听了张小珺采访肖弘的播客后,觉得他们确实很优秀,比如:时机抓得很准(对“套壳”的理解和趋势、提前量、时间窗口的理解),敢决策(比如卖掉公司,比如快速收购),产品感非常好(讲到的一些激发他灵感的时刻),找夹缝(清晰地认识到自己的优缺点,寻找同行可能的缝隙),全情投入(只有工作而没有 work life balance,连续几年春节都在工作)。

  6. 认真想想,我对通用 Agent 的判断,可能还是不会做——我内心还是觉得它挡在了大厂必经的路上。这里面的时间窗口和夹缝很可能不够。但,也可能这只是我的热情和勇气不够而已。记录一下,让我们看看半年、一年后的发展。

  7. 佩服 Manus 团队,祝福。

AI 让我担心,知识星球是不是会遇到危机

前段时间,顾小北问我:

有没有想过,知识付费的出路在哪里?

或者都直接AI了,大部分的自媒体是会更多还是更少了?

或者说,付费的人群是更多更少?

这个话题应该也和星球有关系吧?

要怎么升级?

能报名星球的,大部分都是因为个人IP,所以关系是有的。虽然是关系,但是也是内容,如果内容都可以随便拿,再好的关系,也变弱了。过去我们人和人的关系是靠内容,觉得你不错,我就付费。现在我和你关系还是很好,内容却随处可以拿,一旦到真金白银的时候,这个关系是不是弱了很多?

坦率地说,这些问题,我没有答案。最近打算和同事们对齐 2025 年的目标,做准备时,我还提了一嘴:我有些担心 AI 会彻底打翻内容、付费社区产品,所以我们需要加快探索。

这里记录对这个危机感的一些碎片想法:

  • 在 ChatGPT 刚刚出来的时候,哪怕去年,我都还没有这种紧迫感。但是 DeepSeek 一下让 AI 普惠、破圈了,让我觉得,AI 进入每个人的手机这件事,正在发生。

  • 绝大多数用户分辨不出 AI 创作的内容和人创作的内容的区别——很有可能,一段时间之后,也不再会有区别。我隐约觉得,就像有人觉得胶片拍出来的照片质感好,有人觉得黑胶唱片效果好,有人觉得有价值的画就该画在画布上,但这不妨碍数码照片、数码音乐、电子绘画成为主流。如果这样,是不是很快,AI 内容会成为主流?

  • 如果内容创作被 AI 占据,那么用户们是不是就不会追随某个创作者了?更不会为之付费了?皮之不存,毛将焉附——知识星球这样的付费社区,是不是就会有很大危险?

我目前隐约设想的解法是,让知识星球成为真人的,真诚的互动社区。这里有人味。大家付费进来,是跟人交流。

如果仅仅要一个答案,大家会直接问 AI 了。

你有什么解法可以教我?

这篇是我创业笔记第 810 篇。

碎片

这两天的几场聊天,记一些讨论到的信息。

  1. “每一次大的收敛,都会带来大的机会。比如手机,把照相机、MP3、打字机、书、手电筒、闹钟、手表、信用卡、DVD、电影院、游戏厅、秘书……都收敛到一起,就是很大的机会。AI 眼看也带来了巨大的收敛。”

  2. “能不能让同事们迭代更生猛、讨论更兴奋,不是为了完成任务,而是寻找突破口,努力找到光。”

  3. “开会的时候,产品、研发和运营坐在一起讨论产品。我们这次是——面向大模型开发,产研直接数据丢给大模型,大模型根据 prompt 处理成 json 返回,UI 呈现完事。这时改需求,反而是运营急了——需要改写、测试很多 Prompt。我意识到,现在的开发模式变了。”

  4. “大模型把世界压缩进了模型。我们需要学习的是怎么调用它,怎么问合适的问题,让它们把合适的答案无损地解压,交还给我们。”

  5. “现有的成熟的知识都不该做了,应该做那些 AI 得不到、学不会的东西。AI 压缩世界的过程中,是能腾出更大空间的。比如:是不是大家不用卷,都有钱谈恋爱了,就有很多爱情——这个 AI 应该还学不会”。

  6. “现在芯片厂商挣了最多的钱,然后是云计算厂商,然后 Apps 最少。这个结构应该要倒过来,才是健康的,就像云计算那样。Apps 挣最多——解决了真实世界的问题,然后是云计算厂商,然后才是芯片厂商。”

  7. “如果你担心模型进化会把你做的东西吞掉,那你大概率做错了。如果你对模型的进化极其兴奋,模型越聪明,你能实现得越好,那你有可能做对了。”

  8. “Chatbot 可能不是对的交互模式。想想 Dos 时代的 C:\ 然后一闪一闪的光标——其实就是个对话。然后更自然的是图形界面、鼠标。AI 时代的图形界面会是什么?”

  9. “知识星球里,最重要的是人味。我们当然要借助 AI 的力量,但是要能增强互动。都是 AI 之后,真人社区更加珍贵。知识星球必须是真人社区——我们可能要用 AI 帮我们干掉 AI 生产的内容。”

  10. “在知识星球里,AI 可以促进内容消费——做更好的推荐。也可以提升星主效率——比如帮助分析转化率最高的星球,分析为什么他们的星球转化率高,帮星主们挣更多钱。”

2025 年 2 月阅读

  • The Innovator’s Method - Bringing The Lean Startup into Your Organization
  • Zero to One
  • Breaking Twitter
  • 麦肯锡方法
  • Unwind
  • What I talk about when I talk about running
  • The Innovator’s DNA
  • Five on a Treasure Island

看了一部分但没看下去的:

  • 堂吉柯德
  • 真需求
  • What They Forgot to Teach You at School

推荐的有:

  • The Innovator’s Method - Bringing The Lean Startup into Your Organization
  • What I talk about when I talk about running

此外看过的的 pdf:

  • Training language models to follow instructions with human feedback
  • DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning