扫码打开虎嗅APP

搜索历史
删除
完成
全部删除
热搜词
2026-01-02 10:19

对AI的实践及思考

本文来自微信公众号: markzou的笔记 ,作者:markzou1988


我从9月中旬开始火车环游中国,到12月中旬结束,已经差不多3个月没有更新公众号。


但11月中旬在西安做过一次分享,现在在本文中把内容整理一下,如有不对之处,还望指正,我也在不断学习中。


将从以下四个方面展开分享:


  • 个人AI实操经验:分享我运用AI工具进行旅行规划、内容创作与智能体(Agent)搭建的具体案例。


  • 国内外AI产品观察:对比分析当前AI产品的发展现状与特点。


  • AI发展趋势猜想:探讨技术演进方向及其可能带来的社会影响。


  • 个人的应对策略:面对AI时代的到来,我们应如何思考和行动。


  • 个人AI实操经验分享


    1.AI辅助长途旅行规划


    我目前正在进行一场坐火车环游中国的旅行。最初,我使用腾讯元宝AI助手规划了一次自行车全国旅行,并生成了详细的装备清单。然而,在实际骑行两天后,由于体力原因及广州的台风天气,我放弃了该方案。


    随后,我转向让AI规划火车旅行方案。我向“腾讯元宝”提出了新的需求:


    • 旅行偏好:关注经济发达、产业特色明显的地区。


    • 交通工具:明确以火车为主。


    • 规划细节:要求每日行程具有足够的颗粒度,并最终提供费用预算。


    AI生成的完整方案涵盖了以下细节:


    • 行程总览:广州出发,经沿海、山东、东北、陕西山西、新疆,最终返回四川。


    • 每日详情:包括行程区间、距离、交通时间、当日详细安排、考察重点、住宿地、以及交通、门票、食宿等分项与总计费用。




    实践验证:我对比了AI生成的预算与实际支出(9月与10月数据),发现两者偏差均在10%以内,说明当前大模型在复杂规划任务上已具备很高的实用性和参考价值。


    2.从旅行规划延伸到内容创作


    基于AI生成的旅行方案,我进一步探索其内容创作潜力。


    • 书籍框架搭建:我要求AI根据旅行路线,为我规划一本旅行书的框架。AI迅速给出了包括书名、副标题、序章及各章节(如东南、华北、东北、西北、西南地区)的详细大纲,并针对每个重点城市建议了写作切入点。


    • 自媒体账号策划:我请AI为旅行记录设计一个自媒体账号的运营方案。它基于市场营销的4P原则,输出了包括品牌定位、名称、Slogan(如“Go Go Go出发了”)、简介、内容方向、平台选择、发布节奏与频率在内的完整方案。


    我在国内外主流AI平台上有大量的智能体搭建实践经验。



    • 开发规模:仅在腾讯元宝上就搭建了约300个智能体。


    • 核心逻辑:高质量的智能体需要一套结构化的设计框架,包括:头像、角色设定、基础与延伸配置、参考案例等。这能确保智能体与用户的交互更立体、感情更饱满、考虑更周全。



    • 应用效果:我开发的一些智能体(如珠宝、两性情感、机票、旅游等领域)在各大平台累计服务用户已超150万,对话量巨大。


    4.使用AI的核心感受


    • 效率的极致压缩:规划一场全国性的火车旅行,传统方式可能需要数天时间收集资料、安排行程,而借助AI,仅需2-3小时即可获得详尽方案。


    • 专业门槛的抹平:AI极大地拉平了多数行业的知识门槛。越是公开、易获取的知识领域,AI的赋能效果越明显。这让我能够快速切入无人机、口腔等陌生领域,开发相应的智能体。


    • 持续工作与进化:一旦创建,AI智能体可以7x24小时不间断工作,并能随着底层大模型的迭代而持续提升能力。


    国内外AI产品观察

    1.技术能力布局



    • 基础能力(语言、图片、视频、语音):已成为国内外大厂及科技巨头的标配。


    • 搜索整合:搜索与大模型天生契合。AI能在几秒内调用上百个信息源进行分析。国内外搜索公司及新兴力量(如Kimi)都在强化此方向。


    • 延伸能力:从基础能力衍生出的情绪识别、表情识别、图片精修、商品图生成、宣传视频制作、数字人、智能客服等技术,大厂均已布局,同时涌现出像“美图”这样的垂直领域强者。


    2.应用与解决方案


    • 行业渗透:


      • 智能客服:已广泛应用(如京东平台,需多次要求才转人工)。


      • 商品推荐:京东、美团等平台的对话式推荐。


      • 解决方案:营销方案、医疗辅助、办公套件等领域均有成熟产品。


    • 垂类产品:音乐、游戏等领域也有大量创新。

    3.智能体(Agent)生态对比



    • 国内:模式丰富,包括提示词、工作流、多智能体协作、插件等多种形式。


    • 国外:以提示词为主,工作流和插件生态相对国内较为简单。


    4.产品交付与商业变现


    • 产品交付:国内在应用层和用户体验上目前做得更好。例如,OpenAI的GPT商店直到去年7月才推出,生态仍处早期。


    • 商业变现:


      • 国内:模式多样,包括Token付费、订阅、线索售卖、商品售卖、广告联盟、知识付费、客服等。


      • 国外:目前以订阅和商品销售为主,模式相对单一。


    AI技术趋势猜想


    回顾历史,从1950年代的构想,到2017年Transformer架构奠定基础,再到2022年底ChatGPT-3.5引发质变,AI进入大众视野。目前正处于关键发展阶段:


    • 多模态:仍在发展中,未完全成熟。


    • 具身智能:让AI与物理世界交互(如机器人),目前重点在解决基础运动控制(如行走、平衡),相当于在构建“小脑”,与大模型的深度融合尚浅。


    • 未来方向:最终将走向具身智能与大模型的紧密融合,并由世界模型驱动,向通用人工智能(AGI)演进。


    2.当前架构与未来形态


    • 当前:用户与AI交互,AI调用工具、数据库完成任务。



    • 演进:从单一模型处理所有问题,转向多智能体(Multi-Agent)协作。例如,一个“个人助理”Agent作为调度中心,将问题分类后,交由更专业的健身、租赁等垂直Agent处理,以提升效率、节省算力。



    • 终极感知:AI的感知将不仅限于文字、语音、图片、视频,还将扩展到物理世界,通过温度、触觉、味觉、压力等传感器获取全方位数据,经各类模型处理,再反馈到数字或物理世界。


    3.商业落地逻辑


    每一次技术革命都基于其核心特点找到切入点:



    • PC互联网:核心是信息联通与存储,从媒体、资讯、搜索起步,延伸至电商、在线娱乐。


    • 移动互联网:核心是基于位置的服务(LBS),从社交、O2O起步,发展出移动支付、线上线下融合、万物互联。


    • AI大模型:核心是处理知识与内容。当前已从编程、创意等领域切入,正向着工作流优化、产品形态创新发展,未来必将与各产业深度融合,并进一步与物理世界结合。




    竞争判断:对于绝大多数人和公司而言,机会在于应用层的创新,而非投入巨大的基础大模型研发。


    社会影响与个人应对

    1.对就业的潜在影响



    技术革命总会重塑就业结构。智能革命的特点是从自动化走向智能化,从替代体力劳动转向替代需要经验和判断的认知劳动。一些岗位已受到影响:


    • 明显影响:电话客服、基础程序员、风控专员、线上运营、卡车司机、演员等。


    2.AGI(通用人工智能)面临的约束


    尽管发展迅速,但AGI的实现仍面临多重硬约束,这为我们留下了应对时间:



    • 模型规模:当前顶级大模型参数在万亿级别,而人脑神经连接规模在百万亿到千万亿级,仍有数量级差距。


    • 能源供应:AI算力消耗巨大,能源基础设施建设(如核电站需十几年周期)是长期瓶颈。


    • 芯片性能:需持续提升算力、产能,并大幅降低能耗(当前AI芯片能耗远高于人脑)。


    • 传感器与具身智能:要实现AGI,需从环境持续学习,这依赖更微型、多样的传感器(MEMS技术),以及与物理世界安全、灵活交互的躯体,这些都需要时间发展。


    3.个人的策略与选择


    • 赛道选择:


      • 基础模型:仅极少数公司有能力涉足。


      • 行业模型:对多数公司而言,微调大模型的成本和门槛也很高。


      • 应用开发:这是最广阔的天地。基于现有大模型,结合行业专家知识,开发解决实际问题的应用,是主流方向。


    • 核心建议:深化与真实世界的链接


      • 我们对真实世界的认知本就有限,而能被数字化、用于训练AI的知识则更少。


      • 因此,人的核心优势在于身处真实世界。我们应更深入行业,更理解人性,在实际场景中发现问题、创造价值,这将是人类区别于和领先于AI的关键所在。

    本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
    如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。

    大 家 都 在 搜