• 发文
  • 评论
  • 微博
  • 空间
  • 微信

陈根:马斯克用X数据训练AI,最大的困难是什么?

根新未来 2023-09-05 14:23 发布于浙江 发文

/陈根

94日,马斯克旗下社交平台X(前身为推特)最近更新了隐私条款,X将使用收集到的数据来训练AI模型。

X最新的隐私条款中明确表示,“我们可能会使用收集到的信息以及公开信息,来训练我们的机器学习算法、AI模型等。”对于此事,马斯克也直接承认,并补充称“只会使用公开数据,不会使用用户私信或任何私人数据”。

X的数据对于马斯克而言并不是金矿,尽管马斯克计划用X的数据来训练人工智能。因为X拥有的数据就类似于微博与微信所拥有的数据一样,大部门的数据都属于低质量的数据,或者说是属于脏数据。对于要训练高质量的人工智能模型而言,不仅没有价值,反而会成为副作用。

而马斯克要使用X的数据用于AI训练,首先要解决的一个问题就是成本的投入。也就是说马斯克需要雇佣大量的人员,对X平台的数据进行标注、清洗,并从中筛选出能使用的高质量数据。而数据的这种标注、清洗,就意味着不仅是大量人力成本的投入,同时是一种长时间的持久工作。

如果马斯克不对X平台的数据进行标注、清洗,而直接使用的话,最终训练出来的AI可能就是一个不仅有AU幻觉病,同时还会成为造谣传谣的AI模型。

声明:本文为OFweek维科号作者发布,不代表OFweek维科号立场。如有侵权或其他问题,请及时联系我们举报。
2
评论

评论

    相关阅读

    暂无数据

    根新未来

    预见未来科技与商业,洞察前沿趋势...

    举报文章问题

    ×
    • 营销广告
    • 重复、旧闻
    • 格式问题
    • 低俗
    • 标题夸张
    • 与事实不符
    • 疑似抄袭
    • 我有话要说
    确定 取消

    举报评论问题

    ×
    • 淫秽色情
    • 营销广告
    • 恶意攻击谩骂
    • 我要吐槽
    确定 取消

    用户登录×

    请输入用户名/手机/邮箱

    请输入密码