扫码打开虎嗅APP
智谱AI推出AI视频生成平台“清影”。
7月26日,智谱AI宣布推出基于大模型技术的AI视频生成平台“清影(Ying)”。“清影”平台利用智谱AI自研的DiT模型架构,结合了文本、时间和空间三个维度,通过优化算法,实现了视频内容的高效生成。与前代技术相比,“清影”的推理速度提升了6倍,理论上生成6秒视频仅需30秒。用户可以通过输入一段文字(Prompt),即可选择多种风格,如卡通3D、黑白、油画、电影感等,生成1440x960清晰度的高精度视频。此外,平台还支持图片生成视频。“清影”现已在清言App全面上线,面向所有用户开放。“清影”API也同步上线至智谱AI大模型开放平台。
OceanBase首次披露金融行业营收:2023年2.7亿元。
近日,OceanBase首次披露金融行业营收:2023年达2.7亿元,位列分布式数据库独立厂商第一。
IDC报告显示,该营收规模位列整体第四,仅次于三家云厂商。此外,OceanBase在本地部署市场中也占据市场份额第一。
目前70%千亿资产规模以上银行、75%头部证券机构、65%头部保险机构、45%头部基金公司都已选择OceanBase进行核心系统升级,包括中国工商银行、交通银行等等。
支付宝发布多模态医疗大模型,联合20家机构发起医疗AI共建计划。
在2024世界人工智能大会“可信大模型论坛”上,支付宝公布了其AI技术在医疗领域布局的最新进展:发布多模态医疗大模型,同时,全新推出包括医疗可信一体机、可信云等多款数智化解决方案。现场,支付宝还与人民卫生出版社、北京大学医学部、浙江省卫生健康委等20家机构,联合发起AI医疗共建计划,共同探索AI数智技术底座与创新应用服务。
为了让回答对话更加可靠,在研发阶段,支付宝还与数百个专业医学团队、专家进行合作标注数据,保障信息权威可信,同时联合上海仁济医院推出首个中文医疗专科问答推理数据集RJUA-QA。模型测试阶段,用户、患者、医生参与问答反馈,在专业同时,兼顾患者关怀。
目前,该多模态医疗大模型不仅提供智能问答、病历结构化和检索、辅助诊断,还可识别解读药品及上百种复杂的医学报告,进行毛发健康检测等,这些都能嵌入医院等机构医疗环节全流程 。
蚂蚁百灵大模型升级多模态能力。
在2024世界人工智能大会“可信大模型助力产业创新发展”论坛上,蚂蚁集团公布了其自研的百灵大模型最新研发进展:百灵大模型已具备能“看”会“听”、能“说”会“画”的原生多模态能力,可以直接理解并训练音频、视频、图、文等多模态数据。原生多模态被认为是通往AGI的必经之路,在国内,目前只有为数不多的大模型厂商实现了这一能力。
百灵大模型多模态能力,在中文图文理解MMBench-CN评测集上达到GPT-4o水平,在信通院多模态安全能力评测达到优秀级(最高),具备支持规模化应用的能力,能支持AIGC、图文对话、视频理解、数字人等一系列下游任务。
基于百灵大模型多模态能力,由蚂蚁集团与武汉大学联合研发的遥感模型SkySense,也在论坛上公布了开源计划。SkySense是目前参数规模最大、覆盖任务最全、识别精度最高的多模态遥感基础模型。
通义千问公布OpenAI用户迁移方案。
6月25日,OpenAI宣布终止对中国提供API服务,阿里云百炼第一时间宣布,将为OpenAI API用户提供最具性价比的中国大模型替代方案,并为中国开发者提供2200万免费tokens和专属迁移服务。
根据斯坦福最新公布的大模型测评榜单HELM MMLU,Qwen2-72B得分为0.824,与GPT-4并列全球第四。通义千问GPT4级主力模型Qwen-plus在阿里云百炼上的调用价格为0.004元/千tokens,仅为GPT-4的50分之一。
国内校企发力AI研究,多篇学术成果入选计算机视觉顶会CVPR2024。
当地时间6月17日,全球计算机视觉三大顶会之一, IEEE国际计算机视觉与模式识别会议(CVPR2024)在美国西雅图举办。本届会议共收到11532篇有效论文投稿,接收了其中2719篇,录用率为23.6%,比例低于往年。
清华大学、南京大学、华中科技大学、哈尔滨工业大学、西安电子科技大学、华南理工大学、蚂蚁集团、腾讯、字节跳动等国内高校和互联网企业均有论文被该会议收录。其中蚂蚁集团被收录24篇论文,一篇被组委会重点推荐;腾讯优图实验室公布了20篇入选论文;美团公布了7篇。
联合国AI for Good峰会:达摩院分享AI多癌早筛技术。
5月30日,联合国在瑞士日内瓦召开AI for Good全球峰会,阿里巴巴达摩院(湖畔实验室)受邀分享AI多种癌症早筛技术。随后,世卫组织(WHO)数字健康合作中心宣布与达摩院开展战略合作,向全球推广该项技术,助力更多发展中国家抗击癌症。
达摩院提出“平扫CT+AI”多癌早筛方法,在国际上首次实现胰腺癌大规模早筛,相关论文登上国际顶级期刊《自然·医学》,国际专家称其“基于医疗影像+AI,开启癌症筛查黄金时代”。这也是入选斯坦福大学《2024年AI指数报告》“全球AI亮点研究”的唯一中国成果。
阿里巴巴投资近2亿元,精准学将发布“原生AI”辅学机Bong。
精准学Bong辅学机利用AI技术实现个性化教学,通过定制化学习路径和实时互动,解决教育个性化的供给瓶颈。精准学与阿里巴巴通义大模型合作,研发了具备多模态、个性化交互能力的教育垂直模型,能够自然模仿20种教学风格,并使用16万小时的教育语音数据进行训练。精准学自研虚拟老师技术,使用10小时的视频数据训练,即可创建专属风格的高清AI老师进行互动教学。
第四范式前三月收入同比增长28.5%,行业大模型成主要动力。
5月28日消息,第四范式在财报日前一日公布了2024年前三个月的核心业务表现,公司营收为人民币8.3亿元,同比增长28.5%;毛利润人民币3.4亿元,同比增长21.1%。截至2024年3月31日,第四范式前三个月总用户数为124个,标杆用户数为54个,标杆用户群体平均营收贡献为人民币890万元,同比增长64.0%。2020年1月1日至2024年3月31日,累积服务总用户数为1058个。期间研发投入人民币3.5亿元,研发费用率42.0%。
公布业务表现的同时,第四范式也发布了行业大模型产品“先知AI平台5.0”,这是第四范式业务核心产品近十年的第五次升级。第四范式先知AI平台业务前三个月收入人民币5.0亿元,同比增长84.8%。
蚂蚁集团宣布:将推出密态计算云服务。
5月23日,第七届数字中国建设峰会上,蚂蚁集团公布了下一代隐私计算的新进展——“密态计算”技术体系,并透露年内将发布“隐语Cloud”密态计算云服务平台。
这是蚂蚁首次对外披露“隐语Cloud”密态计算云服务平台。据悉,“隐语Cloud”将围绕数据流转全链路提供数据密算服务、大模型密算服务、密态数据托管、密态数据研发等服务,具有“按需获取、即开即用”特点。
目前,蚂蚁可信隐私计算的核心技术已全部开源,包括“隐语”可信隐私计算框架、“星绽”可信执行环境操作系统Occlum等。
百川智能发布Baichuan 4及首款AI智能助手百小应。
5月22日,百川智能发布新一代基座大模型Baichuan 4,并推出AI助手“百小应”。Baichuan 4相较Baichuan 3 在各项能力上均有极大提升,其中通用能力提升超过10%,数学和代码能力分别提升14%和9%,在国内权威大模型评测机构SuperCLUE的评测中,模型能力国内第一。此外,Baichun 4还具备行业领先的多模态能力,在各大评测基准上表现优异,领先Gemini Pro、Claude3-sonnet等多模态模型。
在Baichuan 4能力基础上,百川智能将搜索技术与大模型深度融合,推出AI助手“百小应”。百小应可以随时回答用户提出的各种问题,速读文件、整理资料、辅助创作等,还具备多轮搜索、定向搜索等搜索能力。此外还会在用户问题的基础上通过一系列提问来帮助用户明确自身需求,给出更精准的答案。百小应现在已经在Web端及移动端各大应用商店同步上线。
通义千问GPT-4级主力模型降价97%,1块钱200万tokens。
5月21日,阿里云宣布通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。1块钱可以买200万tokens,相当于5本《新华字典》的文字量。这款模型最高支持1千万tokens长文本输入,降价后约为GPT-4价格的1/400。
蚂蚁数科签约越南最大IT公司FPT。
蚂蚁数科与越南第一大IT企业FPT Software正式签订合作备忘,双方将基于本地市场技术协同、行业拓展、人才培养等方面进行深入合作。这也是蚂蚁数科重点发力东南亚市场以来,在越南签约的首个重要生态伙伴。通过双方战略合作共建生态,基于蚂蚁数科的典型产品与解决方案也将更加丰富,并进一步提升其本土适配性,有机会快速在更多行业中应用落地,更好地服务东南亚市场的企业数字化转型。
该公司隶属于FPT Corporation,是越南第一大IT服务、软件解决方案和系统集成供应商。同时,公司也是典型的全球化企业,已为30个国家和地区的1000多家客户提供服务,涉及航空航天、制造和汽车、银行和金融、通信、媒体和服务、物流和运输、公用事业和能源、医疗保健和公共部门等行业。
腾讯AI能力升级,文生视频长度达16s。
2024年5月17日,腾讯云生成式AI产业应用峰会上公布了腾讯混元大模型升级。腾讯称,目前混元大模型部分中文能力已追平GPT-4;已支持文生视频、图生视频、图文生视频、视频生视频等多种视频生成能力,支持 16s 视频生成;在生3D层面,可实现单图30秒生成3D模型。
同时,混元大模型在腾讯内部已有超 600个应用场景,微信读书、腾讯客服等已接入。腾讯广告基于混元推出了一站式AI广告创意平台——腾讯广告妙思,助力提升广告生产及投放效率,其中图生图平均点击通过率提升15%。
腾讯云则推出了大模型原生工具链,包括“大模型知识引擎”、“大模型图像创作引擎”和“大模型视频创作引擎”三款PaaS工具,腾讯云称,该平台可以帮助企业用自然语言开发知识服务应用,快速在客服营销、企业知识社区等业务场景落地。
AI虚拟女子偶像团体Sorai.ai官宣出道。
AI虚拟偶像团体Sorai.ai在其官网和YouTube频道上线了首支原创歌曲《Neon Dreams》,该曲由AI独立完成词曲创作与演唱。据官方资料,Sorai.ai旗下所有成员均由人工智能技术生成,但外表、声音与真人无异。Sorai将于4月19日在第十四届北京国际电影节的光影未来环节完成出道首秀,队长兼主唱Fiona将现场演唱《Neon Dreams》。
新石器无人车完成6亿元C轮融资。
专注于L4级自动驾驶无人配送领域创业公司新石器无人车近日宣布完成6亿元人民币C轮融资,本轮投资方包括中金汇融、前海方舟、中金启阳、亦庄国投以及壳牌资本。本轮融资完成后,新石器将继续推进产品技术研发及全国市场交付部署。
新石器无人车创始人 CEO余恩源表示,无人车将全面开启商用车的智能化时代。目前新石器已获得国内30多个省市累计超过10万平方公里的公开道路路权牌照,2024年以来,获得多个客户合计近万台订单。
阿里通义千问升级:免费开放1000万字长文档处理功能。 3月22日消息,阿里通义千问重磅升级,向所有人免费开放1000万字的长文档处理功能。金融、法律、科研、医疗、教育等领域的专业人士,都可通过通义千问网站和APP快速读研报、分析财报、读科研论文、研判案情、读医疗报告、解读法律条文、分析考试成绩、总结深度文章。
生数科技完成新一轮数亿元融资。
近日,多模态大模型北京生数科技有限公司(以下简称“生数科技”)宣布完成新一轮数亿元融资,由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲继续跟投。本轮融资将主要用于多模态基础大模型的迭代研发、应用产品创新及市场拓展。本轮由华兴资本担任独家财务顾问。
在商业化方面,生数科技在B端以API的形式向机构直接提供模型能力,在C端则以垂类应用产品形式按照订阅等形式收费。目前该公司已与多家游戏公司、个人终端厂商、互联网平台等B端机构开展合作,开放模型服务,提供AIGC个性化体验、定制化内容生产等方面的能力。
Stability AI与中国AI创业公司共推视频模型。
2024年2月28日,Stability AI在其官方社交账号上宣布与领先的text-to-video公司Morph AI达成合作,双方基于各自的模型优势,共同推出了一款all-in-one(一体式AI视频创作) 的制作工具——Morph Studio。该工具将颠覆传统视频制作流程,具备了让创作者能够在一个界面中完成生成、剪辑和后期等的便捷功能,支持创作者调用AI模型选择每一个镜头并达到最佳效果。
Morph Studio已开放用户内测邀请,预计将于3月15日开放测试。
阿里云通义千问APP上线免费功能“通义舞王”。
虎嗅获悉,目前,用户在通义千问APP内输入“通义舞王”、“全民舞王”等口令后,即可进入体验页面。用户按照提示要求上传照片后,十几分钟即可生成神形兼备的舞蹈视频。
目前,通义千问首批为用户提供了科目三、蒙古舞、划桨步等12种热门舞蹈模板。据悉该功能背后的算法为阿里通义实验室自研视频生成模型Animate Anyone。早在去年11月底,该研究便在推特、Youtube等海外社交媒体平台爆火,相关视频播放量超1亿,项目在Github上的Star短短数日就超过1万。