梳理一下当前使用的翻译、AI服务

这两天稍微折腾了一下,理了一下武器库,有一点小乱,而且考虑后后续的迭代,所以梳理一下。

特别是,以下场景,如果有更好的方案,欢迎回复告知,感谢。

人肉翻译

  1. 一直使用的 BOB 的社区版

  2. 之前主要是用的腾讯翻译君的 API。主要是系统自带的都不太好用,有几个需要 API 的也都是试用,例如百度&彩云小译,用完就没了。

  3. 昨天和今天一直在看 DeepLX 的服务,可以自己搭建,看着很简单,但我本着能白嫖就白嫖的态度,找了两个免费的,一个是开发者 missuo 提供的,一个 deeplx.org ,最后发现都不能用,浪费了我不少时间。幸亏尝试后者的时候有个提示,不然我可能还在迷茫。

  4. 然后自己部署了一个 DeepLX,给放了进去。

  5. 顺便搜了下 BOB 的插件,发现有个 Google 翻译的插件,随手也加了上去。

网页翻译

  1. 当然是沉浸式翻译

  2. 之前是用的腾讯交互式翻译,其实效果不错。

  3. 尝试添加别的服务,发现自带了免费的智谱 GLM(之前看过消息还以为 VIP 才能用),试用了一下,速度有点慢,效果还不错。

  4. 把 DeepLX 也给放了进去。但是没太理解 DeepLX 的原理,说是免费不限量,但也看到信息说可能会被 DeepL 给限制 IP,没理解,但既然有很不错的智谱方案,自己的就先省着点用。

    其实我猜想所谓的API,就是模拟调用DeepL的网页版服务。但我不懂,就是瞎猜。

  5. 沉浸式翻译支持的模型很多,不过就不折腾了。

  6. 提到插件,还尝试用的是归纳网页的插件,主要用的是Lepton 的 Elmo 插件。也在用Kimi的,但Kimi感觉是那种读书笔记式的,就是会给你标题是什么、作者是谁、什么时候发表的,一条一条的,啰里啰唆。前段也尝试了豆包,哎,这真是典型的2C公司,怎么说呢,恨不得让你整个屏幕都晃豆包的图标,上次看见这样的还是360,安装不到10分钟就卸载了。

RSS翻译

  1. 之前尝试过 RSSTranslator,稍微有点小门槛,而且我尝试的时候,成熟的翻译服务也不多,尝试了一下就搁置在那里了。
  2. 更早之前,几年前,曾经看过使用 Google Script 翻译 RSS 的教程,试了一下,其实挺好的,但配置有点费劲,而且有不少限制,搞了几个 RSS 放进去一直跑到今天,倒是挺稳定的,好几年了,但后来没怎么继续折腾了。
  3. 前一段 Follow 大火,自带翻译和摘要总结,用起来很舒服,但前些天突然不能用用了,说实话很理解,感觉敞开用确实是不少的费用。
  4. 但是,感受到了英文信息源无限制的向你敞开,就不愿意这么放弃,所以回来继续折腾 RSSTranslator。
  5. 之前比较乱,貌似 OpenAI、Moonshoot 等都用过,好久没折腾,好些不能用了。
  6. 新版也支持免费的 Google translator,但我之前的实践,在Google script 里面使用 Google 翻译还是很稳定的,不知道为啥在应用里不太稳定。
  7. 按作者的说明,很多模型是支持 OpenAI 的,但实际放进去都不行,一大通折腾后(也包含 missuo 方案的失败),当前是这样:

标题翻译 & 低频重要博客的全文翻译:使用 DeepL 的API,每月50万字符够用了,胜在稳定,一个假设是官方的服务效果很好。

高频博客和媒体的标题和全文翻译: 使用自己搭建的 DeepLX,主要是担心虽说免费不限量,用量大了又莫名其妙被封。

低频重要博客的归纳:使用 Openrouter 的 Gemini-flash 模型,没理解怎么收费。硅基流动全免费,但是不能用。

  1. 总体而言,感觉RSS翻译应该能有更好的方案,继续探索吧。

内容生成

  1. 有个小网站,有一个需求是用户输入关键词,使用 AI 给出该关键词的解释。

  2. 之前使用 Moonshoot,看了下感觉给的15元额度用的还挺快的。

  3. 现在使用硅基流动的 01万物模型,测试是完全免费的,这一点比 Openrouter 好,后者使用免费的模型也收费,当然,免费的也会消耗资源,能理解。

那也顺便说下写代码吧

  1. Claude 是唯一我使用后想付费的 AI,最近有些编程服务很火,Cursor 和 Bolt,如果我没记错,背后也是 Claude,可惜我想充值都不让(OpenAI 可以用新加坡卡充值,Claude 新加坡的也不让用),现在就是当核武器用,别的搞不定的,或者稍微大的的需求先用 Claude,用完限额就当是强制下班干点别的。

  2. 其他都垃圾的差不多,说垃圾其实也不太好,但和 Claude 相比,差的实在太远,包括 OpenAI,现在经常遇到的问题是一个需求,不舍得用 Claude 或者超限额了,想用别的先试试,结果几个小时搞不定,然后等 Claude 复活,一把搞定。。

  3. 当前实际场景是:

    1. 复杂需求:Claude写好的代码,感觉有些小修改难度不高就让ChatGPT改一下,如果是在改不好,就干别的等Claude冷却。
    2. 简单需求:例如写个脚本,简单些直接用ChatGPT,但是很多时候,还是得用Claude。
  4. 我知道可以淘宝买 Claude,但是官方的太贵,国内的我担心不好用,而且,我也不是专业程序员,可能兴趣一过就 abandon 了。

  5. 还有一个点是貌似可以去白嫖 Poe 的额度,但我总觉得凡是通过api的都没有官网效果好,主要是我老忘记还有 Poe。

哦,还有画图

目前使用的 ideogram,我知道的可能更好的是 Midjourney,但我频率很低,可能1周1、2次,所以付费不划算,其他的

我知道的感觉效果都不太行,主要是国内那些。可能是有好的我不知道。

既然说到这,提一下搜索

前一段主力是元宝,但越来越觉得元宝的能力太差,特别是上下文能力几乎没有。

本来是拿元宝替代 KIMI 的,对 KIMI 的不满主要是价值观太正,就老是:我们换个话题吧,但是感觉 KIMI 的上下文能力还是 OK的,所以一些重复性的工作现在继续让 kimi 做,比如了解一个电影,直接发电影名,会记住之前的 prompts,如果是元宝,每次都要重新输入 prompts。此外,KIMI 现在推出的网页搜索,感觉效果挺一般的。

最近感觉豆包还行,主力已经换成豆包了。就是,重复性的问题,让 KIMI 解决,新的问题,去豆包问。

不用 Perplexity 当然是受不了真人验证,会觉得我别的地方问个问题,10秒都完事了,在 Perplexity 得花1分钟证明我是真人。

类 Perplexity 的 Felo 和秘塔,还没养成习惯,想了下,对于秘塔,主要是我大部分时候需要了解那么详细的结构化信息。

准确和快是最重要的。

有时候,为了不受限于中文信息源,也会使用 Gemini 来辅助搜索。

我之前做过大模型的对话、搜索、归纳能力的测评,其实有些冷门模型,例如周小川的百川大模型效果挺不错的,但 2C 产品就是好的不一定最火,就算测试结果真的证明百川更好,人们可能还是会用豆包。

总结

场景 工具 服务
人肉翻译 BOB 腾讯翻译君 + DeepLX + Google
网页翻译 沉浸式翻译 腾讯交互式翻译 → 智谱GLM
RSS翻译 Google script → RSSTranslator Moonshoot → Openrouter + DeepL + Deeplx
内容生成 AI API 月之暗面 → 零一万物 on 硅基流动
编程 AI (尝试Cursor或者Bolt ?) Claude
画图 AI ideogram
搜索 AI 元宝 → KIMI、豆包

AI眼里的我

最后,说个有趣的点,我在ChatGPT里问「基于我们的历史对话,画一下你想象里的我」,给出的图片如下,感觉把和ChatGPT对话时的我全部拍下来,感觉确实是这样,哈哈哈。。。

同时,可见ChatGPT综合能力确实还是很强的。

image

元宝感觉也还行,但元宝给我感觉是我跟他说的话他从来没记住过,不知道是不是所有人他都会画这么个图。

13bfb52a5d956

豆包就完全莫名其妙了,不知道是不是因为我和他对话还太少。

根据对话画你想象的我

使用 Hugo 构建
主题 StackJimmy 设计