机场杂谈:挥霍 API 和 AIGC

最近总在写一些小玩意,有了 Copilot 和 ChatGPT,我得了一种奢侈的选择困难症——每次写代码之前都会犹豫一下:这次用啥语言呢?

几个小玩具

我给自己做了个播客

生娃和进厂之后,个人独处时间越发金贵,随之而来的问题就是阅读量难于保障了。过去我的阅读流程是浏览邮件列表、固定的播客、推特等信息源头,根据喜好情况搜集到 Pocket 之类的 Read it later 工具里面。但是现在因为缺乏连续时间,待读列表越来越长。想了下也就是跑步和开车的时候耳朵是比较清闲的——灵机一动:“给自己做个播客吧”。

个人使用,当然能省则省,大致定下了这样几个分工和工具:

  • 运行平台:Google Function,免费额度足够每日使用,负责抓取网文并
  • 存储:使用 Google 对象存储,同样免费额度
  • 交互:Github Issue/Comment + Webhook,构成交互界面
  • 翻译和整理:ChatGPT/DeepL,将互联网上抓取的内容进行翻译和排版
  • TTS:Azure TTS 服务免费额度
  • Buzzsprout:支持 API 的播客托管平台,能自动对接 Apple 和 Google 的播客服务目录

选定平台之后,使用 Github Issue 交互,通过 Webhook 调用 Google Function,借助各个服务,完成抓取、翻译、朗读以及发布的环节,最终形成了我自己的播客节目,怎么说呢——聊胜于无吧。

我给自己翻译了一本书

想把一本书翻译成中文,在线等,挺急的。

最近一直在看《Team Topologies》这本书,奈何我的英语水平比我的时间还有限,突然想起 @yihong0618 的项目 bilingual_book_maker,于是用了起来,使用 GPT 3.5 API,大概三个多小时,epub 就变成了一本中英同屏的读物了。如下图:

sample page

老实说翻译效果麻麻地,能看,好在是留着英文对照,倒也不会太影响阅读,推测是因为逐段翻译缺乏上下文支持造成的。

给自己请个运维专家

这是之前公众号文章中提到的 Pipe2GPT 项目,一个没头没脑的 Prompt:作为一个 IT 领域的专家,对于这段输出你有什么看法?我应该采取什么措施?,不管在控制台看到什么输出、或者日志,都用管道发给 ChatGPT,目前看来,知名软件的输出内容都能够得到具备一定可操作性的结果。

所以我想说啥

本领域知识依旧不可或缺

不论是翻译、出图、编程还是辅助创作等等,应该说都惊喜有余,可信不足的。例如

  1. 多次在利用 ChatGPT 生成代码时,出现错误的 API 地址、错误的数据结构等。AI 写代码,开发工作变成调试工作,效率不见得一定会提升。
  2. 整书翻译过程中,因为上下文长度限制,会有较多的错误结果。
  3. 出图跟编码差不多,修修补补的能力也还是要有的。

综上,毫无疑问地,ChatGPT、Midjourney 等的确能够快速出活,然而要达到交付要求,还是需要有碳基人坐镇本领域,才能达成生产级别的目标。

技术又解放了

其实最近给自己写着玩的东西远不止这些,尤其是结合 LangChain 之后,很多以前看似需要“思考”的东西,现在都可以通过一些零碎代码和零钱来解决了。如果有一点 Python 入门的开发和调试能力,结合 Copilot 或者 ChatGPT 这样的工具,就能够完成很多可用的东西了。正如我前一阵朋友圈吐槽说的——对“知其所以然”的需求,再一次被降低了。就像前面几个例子,虽然被朋友耻笑说这种不算个东西,上不得台面,但是的确解决了自己的问题,像生物信息等严重依赖编程的非 CS 专业来说,有了这些新东西的帮助,应该能大大降低工作难度,提高工作效率。

一大波新思路正在接近

用前面提到的 bilingual_book_maker 项目来说,究其本质,其实跟 ChatGPT 并没有很多关系,它只是将 ChatGPT 作为一个跟 Deepl API 等价的可选插件而已,当然这里并没有贬低这个项目的意思,相反地,这个项目给我的思考是——AIGC 的热潮,促使我们对很多传统 IT 领域进行新的审视,简单说又可以翻大饼了。这似乎是第一次,人工智能用这样触手可及的方式深入到各个领域,大概是堪比个人电脑进入家庭一样一股浪潮,除了对各种 IT 非 IT 领域的直接促进之外,应该也会促使对更多问题的深入思考——例如 HR 大概在思考的:

  • 程序员应该裁掉多少?
  • 实习律师留三成还是五成?
  • Prompt 技能要写到 JD 里面吗?怎么考核呢?
  • ….

每个人/组织都需要自己的垂类 AI 支持

众所周知,ChatGPT 一直在嚷嚷他的数据来源仅限于 2021 年之前,以及 Token 数量的限制等(ps,很奇怪,我只申请到了 ChatGPT,一直没机会使用其它几个大模型),导致面对一些垂类或者一些非公开上下文的时候束手无策,因此不论是私有模型还是其它手段,总要有某种方法来支撑这些更加贴近业务目标的需求。

安全隐私要出大问题

ChatGPT 在很多非结构化内容的处理上都有令人有点满意的效果,例如用来审视合同、润色文字作品、撰写周报、评估简历等等。其实很难抵抗把自家材料提交给 ChatGPT 的冲动,最终面对安全隐私部门的惩处,对吧?

更有意思的是,市面上有非常多的 ChatGPT 以及其他 AIGC 平台的代理,甚至已经有了分销和盈利的运作模式,放胆设想一下,一个野生 AIGC 代理,能拿到多少不为人知的大小秘密?

编不下去了

一次喝酒时,曹老板还在笑我:这个 AI 怀疑论者买了 Copilot(甚至 Copilot 怎么读都不知道)。现在我倒是经常在琢磨如何做好一个 AIGC 带路党的事情,可惜脑容量有限,一直没头苍蝇一样四处乱撞。接着航班大延误的机会,随便把这些零碎思考记录下来吧。

Avatar
崔秀龙

简单,是大师的责任;我们凡夫俗子,能做到清楚就很不容易了。

comments powered by Disqus
下一页
上一页