文生视频爆发生数科技商业化重点仍在B端市场

《科创板日报》9月12日讯（记者张洋洋） “我们目前判断下来的话，B端市场有比较明确直接的需求，所以B端是我们长期非常重点的一个方向。C端的话，我们也在不断的探索过程中。”昨日，在生数科技媒体开放日活动上，当问及产品商业化时，生数科技CEO唐家渝如是回复到。

4月底，由生数科技和清华大学联合研发的国内首个纯自研原创视频大模型Vidu面向全球发布，7月底正式上线，全面开放使用，该模型生成视频时长最长为16秒，公司称全面对标Sora。

按照唐家渝的说法，Vidu目前采取SaaS订阅和API接口两种商业化模式。从收入角度来看，目前阶段B端市场收入更大，C端增长曲线“非常高”。

Sora之后，今年上半年，大模型领域最热闹的细分赛道要数文生视频，国内AI厂商加速赶来，一众产品在6-7月迎来发布更新潮。

不过，做好文生视频这件事并不简单，这一点从OpenAI在今年初发布了Sora之后，仍未正式对外开放便可见一斑。

这主要是因为当前的视频生成技术产出的结果与用户期望之间仍存在较大差距，这些模型在理解和应用物理规则方面表现不足，并且在生成过程中缺乏有效的可控性。

在让视频生成更加稳定、可控这件事情上，昨日，Vidu更新了一项功能，全球首发“主体参照”功能，该功能能够实现对任意主体的一致性生成，让视频生成更加稳定、可控。

所谓“主体参照”，就是允许用户上传任意主体的一张图片，Vidu就能够锁定该主体的形象，通过描述词任意切换场景，输出主体一致的视频。

唐家渝表示， "主体参照”这一全新功能的上线，代表着AI完整叙事的开端，AI视频创作也将迈向更高效、更灵活的阶段。无论是制作短视频、动画作品还是广告片，在叙事的艺术中，一个完整的叙事体系是“主体一致、场景一致、风格一致”等要素的有机结合。

可以看到的是，生数科技寄希望于“主体参照”功能，在竞争激烈的视频大模型领域维持竞争优势。

视频作为图像模态的再扩展，将AIGC的技术推向高潮，也让AIGC的应用离大众越来越近。在技术路径上，国内视频生成的主流选择是基于Transformer架构的扩散模型，这一架构能使模型在处理语言、计算机视觉、图像生成等领域表现出扩展能力。

商业方面，从公开情况来看，国内外厂商的商业选择上还是比较类似，即便是像Sora、Runway，都在积极拥抱好莱坞，或者服务广告企业。

在技术路线和商业化路径上，行业内几乎已经处在同质化状态。

对此，唐家渝认为，在技术路线上，现在处于底层架构收敛的状态，同质化并不代表大家所有进展的能力都相同。因为在架构这一大的基础上，中间有非常多的环节，例如怎么有效地去进行Scale up，例如视频如何有效的压缩，都会有非常多的一些技巧、实践的经验在里面。包括说生成的速度，在保证质量的情况下能否保证快速，这些其实都是在所谓架构收敛的大思路下，还涉及到的非常多的算法技巧、算法难点，包括算法工程化的一些难点，这些是导致大家差异性的主要原因。

“商业化选择虽然比较类似，但整体AI生成视频领域，还处于发展前期，国际头部玩家在齐头并进或者叫共同扩大市场。”唐家渝表示，“关于目前的客户选择，生数科技会关注企业和视频的相关性，最直接用于各种视频内容创作的，以及天然与视频内容相关的领域，比如广告、游戏、短剧和影视等。”

面对激烈的市场竞争，他坦言，技术仍是关键因素，目前的视频生成只是初步符合物理规律，还有很高的天花板需要突破，比如更强的模型能力以及更多模态的协同生成。

文生视频爆发生数科技商业化重点仍在B端市场

相关推荐

格创东智人机协同：端侧精益，改写柔性生产“新范式”

格创东智引领武汉制造业迈向“三化”新时代

苹果智能海外上线国产厂商押注AI 欲与之一战

国资委主任张玉卓：将适度超前建设一批智能算力中心

国资委主任张玉卓：加快提升人工智能技术和产品供给能力探索建立一批任务导向、跨所有制的产业发展共同体

最新

顺丰控股：第三季营收724.51亿元归母净利润28.10亿元

TCL科技：前三季度净利润15.25亿元显示业务净利润超44亿元

小米正式公布澎湃 OS 2 系统：CPU 空转时长降低 19%

蓝色光标三季度营收145.65亿元归母净利润1.23亿元

安克创新：第三季度净利增长52.44%

海螺水泥：2024年第三季度净利润同比下降15.13%

热点

基于航顺芯片车规级MCU HK32A040C8T3的汽车拨档开关解决方案

"Google Gemini与ChatGPT对比：Gemini更胜一筹，你选对了吗？"

百万纯电超跑仰望U9，震撼登场，极致性能，引领潮流。

AI与细菌助力，阿尔茨海默症治疗药物研发进展显著。

特斯拉计划裁员10%，精简团队，提升效率，引发市场关注。

AI搜索大比拼：夸克、豆包、天工，谁更强？一睹为快！

马上消金外包催收公司员工被警方带走涉及个人信息安全

理想AI+区块链项目四：创新融合，引领未来，重塑行业格局。

"中兴通讯携手中国电信，高铁5G商用服务创新突破，引领新时代。"

谷歌八才子揭秘AI奥秘，引领未来科技浪潮！

文生视频爆发 生数科技商业化重点仍在B端市场

相关推荐

格创东智人机协同：端侧精益，改写柔性生产“新范式”

格创东智引领武汉制造业迈向“三化”新时代

苹果智能海外上线 国产厂商押注AI 欲与之一战

国资委主任张玉卓：将适度超前建设一批智能算力中心

国资委主任张玉卓：加快提升人工智能技术和产品供给能力 探索建立一批任务导向、跨所有制的产业发展共同体

最新

顺丰控股：第三季营收724.51亿元 归母净利润28.10亿元

TCL科技：前三季度净利润15.25亿元 显示业务净利润超44亿元

小米正式公布澎湃 OS 2 系统：CPU 空转时长降低 19%

蓝色光标三季度营收145.65亿元 归母净利润1.23亿元

安克创新：第三季度净利增长52.44%

海螺水泥：2024年第三季度净利润同比下降15.13%

热点

基于航顺芯片车规级MCU HK32A040C8T3的汽车拨档开关解决方案

"Google Gemini与ChatGPT对比：Gemini更胜一筹，你选对了吗？"

百万纯电超跑仰望U9，震撼登场，极致性能，引领潮流。

AI与细菌助力，阿尔茨海默症治疗药物研发进展显著。

特斯拉计划裁员10%，精简团队，提升效率，引发市场关注。

AI搜索大比拼：夸克、豆包、天工，谁更强？一睹为快！

马上消金外包催收公司员工被警方带走 涉及个人信息安全

理想AI+区块链项目四：创新融合，引领未来，重塑行业格局。

"中兴通讯携手中国电信，高铁5G商用服务创新突破，引领新时代。"

谷歌八才子揭秘AI奥秘，引领未来科技浪潮！

文生视频爆发生数科技商业化重点仍在B端市场

苹果智能海外上线国产厂商押注AI 欲与之一战

国资委主任张玉卓：加快提升人工智能技术和产品供给能力探索建立一批任务导向、跨所有制的产业发展共同体

顺丰控股：第三季营收724.51亿元归母净利润28.10亿元

TCL科技：前三季度净利润15.25亿元显示业务净利润超44亿元

蓝色光标三季度营收145.65亿元归母净利润1.23亿元

马上消金外包催收公司员工被警方带走涉及个人信息安全