ChatGPT 作为我们处理日常数据的工具之一,功能强大。然而,想通过一个指令省略所有中间环节,让它返回一个你想要的结果,这几乎是不可能的。我们只能尽可能顺着它的现有能力,进行数据处理。
最近,我有一个 Excel 文件,其中包含了2万多条的数据,全部是各类名称,比如 Christmas, mountain, Jordon, China 等等,非常多。我希望让 ChatGPT 给每个词条进行分类,例如 Christmas, Halloween, Easter 应该分类为 Holiday,tree, flower, mountain 分类为 Nature,特别是一些影视游戏中的角色,比如:Mario, Luigi, Yoshi 应该划分为“Video Game”(属于 Super Mario 超级马里奥)。涉及的种类可能有成百上千个,我也不确定。
由于数据量太大,ChatGPT 不能对每一个词条进行比对,只能得到小部分词条的分类。我猜想,可能要给出一个框架,即可能的分类提供给它,让它去比对。
后来,我尝试提供一个分类,让它筛选出所有属于这个分类的词条,这样是可以实现的。例如,当我让它筛选出所有属于“Super Mario”中的人物,它基本能筛选出来。
虽然不能一步到位,但能根据内容关系进行的筛选,已经比类似 Excel 中纯文字匹配的筛选,进步很多了。
ChatGPT 进化很快,现在达不到的能力,可能不久后就可以实现。另外,我们自己也要学会把任务拆分成不同模块,让 ChatGPT 能更好地理解任务。