OpenAI也为数据犯难!公司承认使用爬虫 自我设限难消公众怀疑;数据、算力、算法,被视作生成式AI的三个核心要素,很难说哪个更重要。但是,对于OpenAI这类明星公司来说,算力基本上是一个经济...
OpenAI也为数据犯难!公司承认使用爬虫 自我设限难消公众怀疑;数据、算力、算法,被视作生成式AI的三个核心要素,很难说哪个更重要。但是,对于OpenAI这类明星公司来说,算力基本上是一个经济问题,大公司凭借“钞能力”囤积了大量昂贵的硬件,数据稀缺问题才更让其头疼,“不光彩”的数据获取方式总让它们陷入道德危机。以OpenAI为例,其抓取公开数据训练AI模型的行为早就备受争议。据国外科技媒体Insider最新报道,OpenAI近日承认,其推出了名为GPTBot的网络爬虫机器人,用于抓取和收集数据用于大模型训练。
最新评论