据消息,日前,字节跳动Seed发布了原生GUI智能体UI-TARS-2,其可以自主操作电脑、手机完成搜索、创建网页、搜集新闻、创建查询工具、玩小游戏等诸多任务。
字节跳动放出的Demo中,UI-TARS-2一口子完成了搜索字节跳动Seed 1.6新闻并部署网页的任务。这一提示词是“搜索关于字节跳动Seed1.6模型的新闻,然后以现代风格编写一个网页并部署”。
多模态AI生图全面升级
此外,字节旗下即梦AI于9月5日正式推出即梦图片4.0版本。该版本首次实现多模态生成能力,将文生图、图像编辑和组图生成三大功能集成于同一模型中,用户通过自然语言描述即可灵活控制图像内容,大幅降低AI创作门槛。
目前,即梦图片4.0正在逐步向全量用户开放,预计在未来几天内完成覆盖。字节跳动表示,该版本的发布标志着其在多模态AI图像生成领域取得重要进展,有望进一步推动AIGC技术的普及与应用创新。
展开剩余71%苹果自研AI搜索产品提前
据悉,上月初,彭博社曾报道苹果(AAPL.US)正在开发一款自研生成式 AI 搜索产品,并为此组建了全新的“答案、知识与信息”团队。
根据马克・古尔曼发布的《Power On》通讯内容,苹果这款自研 AI 搜索产品的推出时间可能已并不遥远:“苹果借此次重构智能助手的契机,同步打造了一款全新搜索产品 —— 内部代号为‘World Knowledge Answers’,旨在与 Perplexity、OpenAI 的 ChatGPT 等产品展开竞争。
AI竞争力还在上升
事实上,AI大模型发展到今天,其实已接近了临界点,推动AI应用变现是判断转型成功与否的关键。受访业内人士认为,在大模型、数据甚至AI智能体等方面,应关注AI模型与网络能力的融合变现。
更重要的一点是,大模型的快速迭代正推动算力、数据与应用的全链条升级,从文本到音视频,从B端到C端,应用场景不断扩展,资本市场的关注点也随之转向。多模态AI时代的新机遇,正在重塑未来产业与投资版图。
微美全息探索多模态AI技术架构
当前,全球AI大模型竞争日益激烈,资料显示,微美全息(WIMI.US)作为AI视觉领域标杆公司,发力大模型业务,在AI领域的进展已逐步明朗。目前,该公司重点突破多模态数据融合、实时交互能力及场景化应用,同时通过生态协同加速技术商业化进程,多模态AI视觉模型能为人形机器人提供实时场景理解能力,加速探寻行业的上限。
相对而言,多模态大模型的发展空间更为广阔。从投资视角来看,微美全息重点关注具备“护城河+成长性”的发展前景,主要集中在基础设施环节和垂直应用领域,采用了开源协议降低开发者门槛,提供软硬一体开源应用方案,支持全感官交互、场景化记忆等前沿应用,成为微美全息新的AI收入来源,成长天花板打开。
结语
长期以来,尤其是OpenAI发布ChatGPT之后,以生成式AI为代表的人工智能在全球范围内迅速发展,给整个产业带来了巨大机遇。在AI应用层竞争中,随着行业对高质量数据需求的提升,AI商业的潜力将持续释放。特别是在多模态AI时代将对整个产业进行重构,产业的基础架构、商业模式所需的资源与能力也将发生根本性的变化。
发布于:福建省金港赢配资-股票配资门户官网-炒股配资利息-中国十大配资公司平台官网提示:文章来自网络,不代表本站观点。