我与机器学习的前缘

我大学之前住在耒阳市。耒阳市属衡阳市管辖,毗邻南边的郴州。那时在线天气预报不发达,经常只能选到衡阳市。即使有些地方允许选耒阳市,我也感觉预报不准确,反而不如选衡阳市。于是我萌生想法,能不能结合衡阳市与郴州市的天气预报,给出相对准确的结果。我想用计算机解决,但我发现不了其中规律。那么我还希望计算机能发掘出来。后来我知道这就是机器学习。

去年末出现的 ChatGPT 真惊艳。我从小就对类似的聊天机器人感兴趣。记得腾讯 QQ 至少推出过两次官方机器人。年早的还有小 i 机器人。比较近的例子则是小冰、Siri。这些机器人大多只能返回固定的结果,相当多的问题会回复不知道,聊过几轮便很快厌倦。固然小 i 可以查天气,小冰可以猜人名,Siri 可以设定闹钟,但完全不像人类那样能自由自在谈天说地,纯属戴着开发者的笨重镣铐跳舞。因此 ChatGPT 刚推出我便试用,试用便惊叹。尽管感到它盲目自信,也仍会来回说车轱辘话,但小时候把玩废物的经验让我果断高度评价。

《快乐星球》有一集讲述主角由于自动写日记程序造成误会的故事。来自快乐星球的法宝,输入关键词就能写日记,小学的我也想要啊。但我不知道哪里有;掂量掂量我的编程技术,我也不知道怎么做出来,只能做做白日梦。如今有 GPT 这类生成式 AI 就不是梦了。生成式 AI 就是一种机器学习应用。我大学写闪星空间《关于我》,留下一段 HTML 彩蛋,是一些声明元素定义,指望未来浏览器能展示自动问答系统,回答访客关于我的问题。如今利用类 GPT 模型微调,或者结合向量化文本,完全能自己捣鼓实现。别说一个《关于我》页面,整个博客塞进去都没问题。

诚然,自动写日记程序不是非用机器学习不可。刘慈欣的电子诗人,基于给定规则的专家系统,表现同样可说不俗。我一度嘲笑人工智能(机器学习)工程师为“调参工程师”,但我这“增删改查工程师”又高级在哪呢?大学上课瞧不起机器学习中的线性回归,不过是用数学最小二乘法解决的事:用统计学家给出的确定公式,又快又好,割鸡焉用牛刀?全然不顾数据多维度。如今我认识到,让机器自主发现规律,就是有种魅力。我要摈弃孽缘,再续善缘。我开始走近一点,一个关于我的问答系统近在眼前;登高而招,我毫不怀疑将来机器会代替我写博客。我写这个博客某种程度上就是为迎接这一天。

Try Ctrl+Enter :)