Posts for: #Tech

给自己和家人装个龙虾助理

最近打听小龙虾的朋友有点多,所以我干脆写篇短文,把文科背景朋友们最经常问的问题,做个粗浅的回答。

第一步:我需要什么?

找一台独立的旧电脑。

建议用一台不用的旧电脑专门跑它。原因有两个:

一是稳定。你大概率会希望这个助理 24 小时在线——半夜收到重要邮件能帮你处理,每天早上自动发一份新闻摘要,你不在的时候也能替你盯着事情。用日常办公的电脑跑,合上盖子就断了。

二是安全。这个助理会接触你的邮件、日历、文件,给它一台独立的机器,跟你的工作环境隔开,万一配置出了问题,也不影响你日常用的东西。

五六年前的笔记本就够,Mac、Windows、Linux 都行。

没有旧电脑怎么办?

• 树莓派,几百块钱,功耗极低,放在角落里一直跑

• 云服务器(VPS),每月几十到一百多块,不用管硬件

• Mac mini,如果你本来就想买一台——这是极其豪华的配置

在中国能用吗?OpenClaw 本身没有限制。但它需要调用 AI 服务(比如 Claude、GPT),如果网络访问不了这些服务,需要想办法解决,或者选用国内能访问的 AI 模型。

注意,这里强烈建议:用独立设备,跟你的工作电脑分开。

───

第二步:要花钱吗?

OpenClaw 开源,费用来自 AI 模型——就像请了一个助理,AI 模型是助理的大脑。

我最直接的建议:用你能用得起的最贵、最好、最聪明的模型。

模型笨,相当于助理笨,你要个笨助理干嘛?以及,笨助理更容易被网页里藏的恶意指令操控,如果被骗了,一次损失,估计就够付这辈子的模型账单了。

AI 模型的能力差距非常大。便宜的模型能聊天,但理解力、判断力、可靠性都差不少。你既然花时间把助理搭起来了,别在最关键的大脑上省钱。一个聪明的助理能帮你省的时间,远超模型费用。

轻度使用(每天聊几轮,偶尔帮忙查东西),一个月大概几美元到十几美元。重度使用会更多。

如果你有一些 AI 的订阅,可以请懂技术的朋友看看,说不定无需额外付费就能使用。

第三步:装上它

安装过程需要有人帮你在电脑的终端里输入几条命令。不复杂,但如果你从来没用过终端,建议找个懂技术的朋友帮忙,十分钟就能搞定。

装好之后,OpenClaw 会自带一个网页聊天界面,打开浏览器就能跟它说话。

但更多人是想在手机上随时跟它聊,可以把它连到一个聊天工具。海外用户推荐 Telegram(配置最简单)或 WhatsApp。

中国用户怎么办?Telegram 和 WhatsApp 在国内不能直接用。几个替代方案:

• 飞书(Lark)——OpenClaw 支持飞书机器人,国内直接可用,适合个人和团队

• 网页界面——装好就自带,不依赖任何第三方聊天工具,打开浏览器就能用

第四步:搞清楚它能帮你做什么?

从聊天开始。

刚装好的时候,先就当它是一个聊天对象。问它问题,让它帮你查资料、翻译、写邮件草稿、整理想法。用几天,找找感觉。

然后逐步给它更多权限。

当你觉得它靠谱了,可以开始授权更多能力——读你的邮件、管你的日历、帮你搜索网页、定时执行任务。

具体怎么授权?直接问它就行。跟它说"我想让你能帮我读邮件"或者"我想让你每天早上给我发一份新闻",它会告诉你需要做什么配置。这些配置通常就是几步操作,它会一步步带你完成。

它有记忆。你告诉它的事情,它会记住。下次你再跟它聊,不用从头说起。

每个能力都可以单独开关。一个一个加,逐步建立信任。

下一步:给家人也配一个

不需要再买电脑。同一台机器上可以跑好几个独立的 AI 助理,每个人一个。

每个人的助理完全独立:

[阅读全文]

推荐一个同事做的小工具:PDF书签易

你有没有遇到过这种情况:好不容易找到一本 PDF 电子书,打开发现没有书签目录。几百页的书,想跳到某一章只能一页一页翻,或者疯狂按 Ctrl+F。

我一个同事就被这个问题折磨够了。

从自己的痒点开始

他喜欢用 PDF 看技术书。网上找的、淘宝买的扫描版,很多都没有完整的书签目录。市面上能加书签的工具不是没有——福昕阅读器可以,WPS 也行。但体验都一样:一条一条手动添加,点击、输入标题、设置页码、设置层级,循环往复。一本 300 页的书,光加书签就要半小时以上。

淘宝和闲鱼上甚至有专门代做 PDF 书签的服务。按目录页收费,每页 1-2 块钱,一本普通的书大概 10 多块,耗时一个小时左右。头部商家月销几百单。

说明这个需求是真实存在的,而且现有的解决方案都很原始。

先用最笨的方法解决问题

他没有一上来就做 APP。

第一步是写了一个 Python 命令行脚本:照着 PDF 的目录页,在一个 TXT 文件里用缩进表示层级,写好标题和页码,脚本读取后自动写入 PDF。

甚至目录都不用自己敲——去电商网站搜这本书,商品描述里的目录直接复制过来就行,还自带页码。

这个"工程版"工具,让他制作一本书的书签只需要几分钟。他拿这个效率去闲鱼接单,还真卖出了几十块钱。

这个阶段很有意思:用最低成本验证了需求,同时验证了解决方案。

从工具到产品

命令行版本只能自己用,推广不了。于是他启动了创新项目,目标是做一个真正的产品级桌面应用。

核心交互很优雅:窗口左边是 PDF 页面预览,中间是书签文本编辑区,右边是实时生成的书签树预览。像写代码一样写书签——用缩进定义层级,所见即所得。

几个亮点功能:

• 内置 OCR:扫描版 PDF 直接识别目录页文字,省去手动输入

• 智能页码校准:扫描版 PDF 的页码和实际印刷页码经常对不上,用一个简单的 (++5) 语法就能批量修正偏移

• 自动格式化:识别 1.1、1.1.1 这种标准编号,自动生成对应的层级缩进

• 纯本地处理:所有文件都在本地完成,不上传服务器

技术选型值得说说

他没用 Electron(太臃肿),选了 Tauri:Rust 后端 + Web 前端。PDF 渲染和 OCR 都直接调用系统原生 API——macOS 用 Swift 的 PDFKit 和 Vision,Windows 用微软官方的系统 API。Rust 通过 FFI 调用编译好的静态库。

[阅读全文]

找餐厅这件事,一百条好评不如一个靠谱的朋友

我越来越觉得,找餐厅这件事,大众点评、小红书都帮不了我。

倒不是说它们不好用。信息多,评价全,但问题就出在"太多"上。我打开一家店的页面,几百条评价,有说惊艳的,有说踩雷的,有明显是刷的,有写了一千字但你也不知道这个人平时吃什么水平的。看完一圈,我还是不知道该不该去。

后来想明白了,问题是:我不认识这些人。

我不知道他们的口味,不知道他们的标准,不知道他们说的"好吃"到底是什么意思。一个觉得"好吃到哭"的人,跟我可能完全不在一个频道上。这种评价再多,对我来说就是噪音。

但如果是朋友呢?那完全不一样。

我知道他是什么样的人,知道他吃过什么东西,知道他说"这家不错"意味着什么。他的推荐我是可以直接信的。

这就是我们做 EatVenture 的原因——它不是大众点评,它是朋友点评。

我在 EatVenture 上只关注我认识的、喜欢的、且我认可 Ta 饮食品味的朋友。注意,不是所有朋友。认识归认识,但有些人吃东西的口味跟我差别太大,我会关注 Ta,但不会订阅 Ta 的餐厅列表。我只关注那些我觉得"真的懂吃"的人。

然后我会主动把 EatVenture 发给他们,拜托他们把自己喜欢的餐厅标注上去。

这些人可能是每次出差都能摸到当地最好馆子的同事,可能是在某个城市住了十年把好店全吃遍了的朋友,也可能就是那种朋友圈发什么吃的你都想问一句"这是哪家"的人。

这样一来,下次我去他们去过的城市,打开 EatVenture,沿着他们吃过的路线走一遍就好了。不用做攻略,不用翻评价,不用纠结。因为推荐这些餐厅的人,是我自己选过的。

找餐厅,数量不重要,精准才重要。一百条陌生人的好评,不如一个懂吃的朋友跟你说一句"去这家"。

朋友点评,大于大众点评。

EatVenture 是一个很小众的 App。它不是为所有人做的,就是为你和你信任的那几个朋友做的。但就是这个"小",让它特别好用。

这个小工具也并不为所有人设计,目前用的是 Google 的 API,大陆餐厅数据很不完整(不推荐使用),反而是香港、新加坡、日本等地方,陆陆续续被朋友“占领”了。

如果你想试试,可以识别这个二维码,至少新加坡、香港的餐厅还挺完整:

知识星球的 10 年

知识星球 10 岁了。一个小工具 10 岁,在这个宏大的时代下,微不足道。自家的孩子,出生在移动互联网的尾巴,当下赶上 AI 凶猛地冲撞过来,还是幸运的。

试图回忆过去的时候,我发现,能被记住的,往往是一些问题、低谷。

跟大家分享几个低谷。

事故

说出来大家可能会笑——其实,早期版本被 @Fenng 在朋友圈、微博推荐的前几次,都直接把服务拖垮了。

第一次挂的原因是,每个用户登录的时候,都会一次性把圈子里的用户列表拉回来,几千个用户通讯录信息、头像,几千个人同时拉——嗯,在我们还是单服务器的时候,瞬间就雪崩了。

2021 年,生财有术 418 续费,在 20:00 秒杀开始时,数据库没撑住,甚至导致了付款方面的问题,比如付了费,我们却没准确记录。那次给生财有术团队带来了挺大的后续工作量。

那之后,为了让整个活动更加顺滑,研发团队做了些工作,比如:

  1. 后端、运维工作
  • 压力测试,通过压力测试,找出木桶的最短板,从而不断做性能调优

  • 数据库按业务拆分成多个集群,进一步减轻数据库压力

  • 代码级调优(核心目的是为主库减负)

  • 限速,如果达到我们压力测试的峰值,对来访用户进行排队、降级等限制

  • 临时扩容,根据去年的经验,将服务器做了短期大幅扩容,活动结束后释放

  1. 前端工作
  • 页面静态化

技术上的调优,加上微信支付给力的协助,那之后就没出过这么大事故了。

2017 年的下架

2017 年,因为风控、内容安全问题,产品被下架,后续会如何,一无所知。我后来发了张照片,记录:这张照片是 2017 年 6 月 30 日拍的,那时公司遇到一个很大的坎,尽了全力东奔西走。所幸贵人相助,指点、计划、执行、核查、修正,投入很大的精力和成本,走出来了。那会儿,在等机会去拜访人,外面天热,猫在地铁站里,有点累,盘腿在地上坐着,闭目养神。shotgun 拍下来了。偶尔翻到,还是会回忆起那个炎热的下午。创业就是这样,如履薄冰。

那段时间还有另一张图片——归零的图片。

创业公司,很大概率活不过下个月,所以,或许不用规划太长远,尤其是现在的巨变时代,我们也根本看不清三个月后的世界变化。

找到光

除了低谷,当然也有欣喜,比如找到光的欣喜。

在回顾时,我翻了旧照片,找到一张 2015 年 5 月 6 日,在腾讯大厦拍的照片,这是个起点。白板上的草稿,是 Tony 随手画下的。

那时候,我们观察到的问题来自微信群。

用微信群沟通极简、便捷,很多人的生活、工作中都离不开。我自己就大量在工作中使用微信群——与同事、伙伴、用户在群里沟通,迅速解决问题。在重度使用过程中,我也感受到了一些不便,比如:精华内容不连续不易整理、内容不备份很容易遗失遗忘、文件图片不及时下载很快被清理、时常被各种表情包红包或者无关话题岔开歪楼导致讨论不聚焦等等。

我们认为,一个简单的移动端社区,可能会是微信群的良好补充,而海量使用微信工作的人们,也将是我们的目标用户群。于是我们花了几个月时间,把产品做出来了,2015 年的 11 月 10 日,第一个对外公开的版本发布了,版本号是 1.1.1——从 0.9 版开始,内部已经迭代过几个版本。

但,就像绝大多数创业公司的创业项目那样,产品开发出来后,我们尝试着在网络上做了些推广,响应者寥寥。我尝试着找一些朋友——有在传统企业里负责信息技术的,有各行各业野路子的创业者,也有活跃在社交媒体的内容创作者。大多数朋友都会下载,登录测试,然后遗忘。

所以,我们一边自我怀疑,一边做各种迭代尝试。

第一个支持付费的版本是 1.15.4,在 2016 年 8 月 12 日上线。发布日志了,我们写了:

[阅读全文]

你验证过吗?

昨天在 Twitter 上,很多人在“围剿”微信,其中有一位用户写:

不知道你们知不知道,微信传任何文件,即使是同一个文件都是全量拷贝一次。七天文件显示过期的时候,其实文件还在手机里,就是不给你看,如果此时你的朋友再发一次给你,还是会全量拷贝一份放在手机里 这就是为什么微信这么占空间的原因,这难道不是技术上的缺陷吗?

一个 1G 的视频,发给 3 个朋友,就占掉 3G 的内存

我忍不住回复:你验证过吗?

这让我想起多年前,我还在绿盟工程部当售前工程师时的一件小事。几个同事朋友约了,某个周末聊点技术——交流彼此近期看到有意思的技术、项目、产品。我分享的是一篇文章里提到的安全项目,当时在我看来还比较新颖。

我讲完后,同事“小吱吱”问了好几个问题,我都答不上来,他有点诧异,问我:你验证过吗?

我说:没有。

那时我还是挺惭愧的——没编译部署测试过,没看过代码,拿着一篇文章就满嘴跑火车了。

后来我会尽量让自己靠谱一点,传播之前,尽可能有判断,有验证。

简单,可靠,其实很难做到,共勉。