扫码打开虎嗅APP

科技是创新的艺术

  • 王沁

    人类数据耗尽怎么办? 外滩大会热议数据技术新趋势。

    9月5日,在2024 Inclusion·外滩大会上,由蚂蚁集团、上海交通大学、复旦大学联合主办的“从DATA for AI到AI for DATA”见解论坛召开。

    大数据时代,数据的价值还没来得及充分挖掘,AI时代一到,数据却面临着消耗过快的挑战,这使得合成数据技术成了热门领域。据研究机构Epoch AI在6月发布的报告显示,从2026年起,人类产生的新数据量将比模型学习的新数据量要少,预估到2028年大语言模型将耗尽人类数据。

    昆仑万维&天工智能首席科学家、新加坡工程院院士颜水成认为,模型结构还会继续升级,大模型目前推理能力不够等众多的遗留问题,最好的解决途径可能是用合成数据,但做法不同,不应是根据原来的数据合成新的数据,而是通过大模型之间相互的对话、讨论、评价,最后产生出更好、更高质量的数据,这些数据将会大大去提升大模型的效能。

    2024-09-06
    2
    0
    1
    • 嗅友Ol7wj 合成,不就是造假数据🤥
    • 人生何处不相逢. 这类主题就等于大海海水耗尽怎么办?
END