总市值近45亿港币,AIGC第一股出门问问流血上市!首日破发开跌超21%

来源:AI前线
整理 | 凌敏、冬梅

出门问问成功上市成 AIGC 第一股

刚刚,AI 公司出门问问正式在港股上市,报 2.98 港元,总市值约 44.45 亿港元。据悉,出门问问首次发行约 8457 万股股份,每股定价 3.8 港元。


月初时,据报道,出门问问已通过港交所上市审批,并拿到证监会 IPO 备案,并表示将于今年上市,而距离通过审批刚刚过去了半个多月,如今出门问问已经成功登陆港股。

出门问问是一家以生成式 AI 与语音交互技术为核心业务的 AI 公司。据灼识咨询行业报告,出门问问是亚洲为数不多的具有建立通用大模型能力的 AI 公司。按 2022 年 AIGC 解决方案收入计,出门问问是中国起步最早、营收最高的专注于 AIGC 技术的 AI 公司之一。

图片来源:由GPTNB生成

招股书显示,出门问问 2021 年、2022 年、2023 年营收分别为 3.98 亿元、5 亿元、5.07 亿元。

图片来源:由GPTNB生成

公开信息显示,成立至今,出门问问共完成七轮融资,累计融资超 2.55 亿美元,投资方包括红杉资本、真格基金、SIG 海纳亚洲、Google、圆美光电、歌尔声学等。据招股书披露,出门问问 2013 年 2 月的投后估值为 510 万美元,2019 年 9 月的的投后估值为 7.57 亿美元,六年估值翻了 147 倍。

上市后就高枕无忧了?

出门问问长期专注于生成式 AI 与语音交互技术的研发,并在行业发展初期就已经凭借先发优势占据了大片市场。然而,虽然在技术上取得了不少成就,但 AIGC 赛道上的竞争也充满了腥风血雨。

在面对如此激励的竞争环境时,如何持续保持住技术上的优势、加速技术在现实应用场景中的落地并实现盈利,成为了出门问问上市之后无法回避的“大考”。

之前,资深产业经济观察家梁振鹏在接受集微网采访时表示,国内 AI 企业在研发、人才等领域需巨额资本的投入,方能在规模业务和效应上实现提升,因此需要各大金融机构倾力注资来支撑 AI 公司的可持续发展。所以,初期国内 AI 企业还是较看重规模发展,而轻公司业绩、利润,导致亏损成了常态。

可见,上市后并非此后就高枕无忧了,而只是万里征程的刚开始。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

这个禁止打字,只能发语音的AI Native产品,成了硅谷最火的社交软件

过去一周,硅谷线上到处充斥着求链接的声音,人们争相涌入一款新的邀请制神秘AI社交应用。上线短短八天,下载量就超过5万次,新用户甚至一度将平台冲垮,导致其不得不暂时关闭注册功能。


这个忽然爆火起来的社交媒体App叫 Airchat,鼓励用户“随便聊聊”。

它被称为「有声版X」或「文字版Clubhouse」,将两者的信息流形式和音频优先结合于一体——用户不能打字键入,发帖和回复都只能用说的。并且令人眼前一亮的是,这款“AI Native”社交产品将最新AI技术集成入整体交互,背后大模型能将用户发布的语音同步转录成文字,还能根据你选择的语言进行精准翻译。当别人滚动浏览信息流时,就会同时播放声音和呈现文本。

由于起初每名用户开始仅开放两个邀请名额,充满了私密圈子的吸引力,加之声音与文字的新式表达媒介,让Airchat在硅谷科技人士、风险投资家、初创公司合伙人、科技媒体记者等最“超前”的人群中瞬间病毒式传播。

它也火速吸引了一批圈内红人入驻,包括OpenAI 创始人 Sam Altman、Y Combinator 首席执行官Gary Tan、Spotify 首席执行官 Daniel Ek、美国传奇酒商Gary Vaynerchuk,以及风投家和马斯克知己 Jason Calacanis等等。

跟这些名人用户一样耀眼的还有Airchat两位鼎鼎大名的联合创始人。

一位是美国知名天使投资人、全球最大创投平台AngelList前CEO 和创始人Naval Ravikant。他被称为股权众筹鼻祖,信徒众多,个人投资过包括Uber、Twitter、FourSquare、Clubhouse等在内的200多家科技公司。

Naval还曾出版过一本《纳瓦尔宝典》,讲述自己从白手起家到财富自由的经验感悟,分享如何“不靠运气”地过上富有而幸福的一生,中文版在读者中非常受欢迎。

另一位是美国最大约会交友软件Tinder前首席产品官Brian Norgard,任职期间推出的Tinder Gold、Superlike、Boost等重要功能极大推动了用户增长,帮助Tinder成为当时全球收入最高的移动应用之一。

此次两人下场打造Airchat 瞄准的需求很简单:重拾人与人之间的真实连结,提供发起真诚对话的场所,“想一想,你有多久没有在社群媒体上真正感受到与人社交的活力了?”

其实初版的Airchat早在去年10月就上线过,只是当时属性较杂没激起太大水花。今年4月,开发团队删除了视频和文字功能并简化界面,改为纯靠语音的全新App版本横空出世,迅速引爆社交网络。

从视觉上看,Airchat的界面很直观,类似于X。启动应用后会进入按时间轴排序的语音信息流。点击播放声音,同时能阅读文字。

用户之间可以互相关注、评论、点赞、转发和发送私信,但一切表达都是以声音的形式。长按屏幕底部的麦克风键开始录制,松开后你的语音便签加转录文本就会立即自动发布了。

如果对自己的表现不满意可以删掉重录,也可加为高亮、或分享到instagram、Facebook等其它平台。录音后还可以添加外部图片或链接,但无论如何就是不能打字。

从当前用户反馈来看,单条信息的录制时长似乎没有限制,有人甚至为了极限测试连续说了一个小时。倘若对一些太长的语音帖子没耐心听,可以选择暂停只浏览文字。

原本Airchat默认的是2倍速播放,这也成为产品一大特色。被《连线》杂志评价为“给每个人一种略显亢奋,刚刚起床就狂饮一杯Philz咖啡,然后立马跳进浴缸冰镇泡澡的感觉。”诚然这样会让人听起来更自信和强势,但很快被社区反映聒噪,语速过快跟不上。现在Airchat已经把默认改为原速,用户也可通过点击播放键来自主调节1x, 2x,3x速度.

这样的语音先行格式让很多人想到了Clubhouse。

这款尘封在记忆里的音频应用曾在 2021年全球疫情期间创造过一个巅峰流行时刻。其界面设计模仿现实生活中的俱乐部或聚会场所,用户同样是通过邀请制加入聊天室,线上就能与马斯克、李开复等名人零距离实时语音对话。只是随着时间推移,在人们恢复线下社交后,Clubhouse失去了持续价值,逐渐淡出了人们的视线。

那现在的Airchat是第二个Clubhouse吗?事实上两者有很大的不同。

相比 Clubhouse 的多人开放聊天室,Airchat更重视一对一交流,每两人之间的对话都形成一条独立Threads信息流。

同时,Airchat是异步交流。能透过录音完整地组织论述,讲不好可以重录,降低了在一群人面前讲话的紧张感,i人友好。

Norgard 认为,这种方式消除了参与者的怯场障碍,因为“你可以在这里尽可能多地尝试撰写消息,没有人会知道。”事实上,他在与早期用户的对话中,发现“今天使用 Airchat 的大多数人都是非常内向和害羞的。”

Airchat 的语音内容也不像Clubhouse那样聊天解散后就丢失了,而是使用AI的语音转文本功能保留下来,可以追溯,转录体验不仅速度快而且质量很好。一些明显的语气词”呃”会出现在记录中,但轻微的停顿和无意义的填充词则会被编辑掉,语意准确,支持中文,还可以多语言翻译。所以总体来看, Airchat更像是人工智能技术加持的有声版 Twitter 。

Airchat的风靡似乎是一夜之间。除了前面提到的异步交流消除社恐,和两位创始人本身在创业和风投圈不容小觑的影响力,开发团队认为,Airchat 是一种令人耳目一新的亲密社交方式。与单靠生硬的文字不同,声音是有温度的,能够为每个人的个性带来更丰富的表达。

许多人在网上认识多年,在 Airchat互相关注后才听到真实的声音。当头像、文字和声音结合在一起时,会勾勒出一个更真实、立体的人物画像,让你在社交网络里变得更有吸引力。

另外,一些其它平台的名人账户背后也许是团队代操作。但在Airchat,你能清楚听到并确认这就是本人。这些明星用户在X上的营销造势,以及邀请式准入门槛也给大多数普通人带来强烈的FOMO心态,迫切希望加入圈子一探究竟。

所以Airchat里到底长什么样?有媒体评价说,它现在的感觉就像旧金山的咖啡店——应用上大多数人都与科技行业存在某种联系。这也许是因为科技爱好者通常是第一批尝试新事物的人。而当前平台上的主要内容也极大反映出硅谷科技圈的泛流行文化。

当Airchat最初推出频道功能时,最先出现的两个频道是「Crypto(区块链)」和「e/acc(有效加速)」,人们在这里讨论应用本身、人工智能、比特币、“长生不老”,每一个都带有强烈的旧金山式符号。尽管也有咖啡、占星术、音乐、运动等频道,但最响亮和受追捧的还是科技向的话题。

Ravikant表示,目前Airchat的资金主要来自于他自己的口袋,“Sam Altman也盲目地投了一些钱,他喜欢任何人工智能相关的东西”,而该应用本身的盈利计划仍不明确。

在被问及“什么时候可能开始看到广告,无论是音频还是其他形式”时,Ravikant 说,”公司根本不存在货币化压力”,”我一点也不在乎货币化。如果有必要,我们会甚至会花少量钱来运营这个东西。”——言外之意就是不差钱。

另一个让外界潜在担忧的是内容审核问题。现在平台上任何用户都可以录制任何内容,公开发布到时间线。在一个名为「战争」的Airchat频道中,有人在输出着一些强硬观点、未经证实的新闻报道,甚至于宣扬纳粹…另有人发布语音挑衅和辱骂,而其他用户能做的也只是屏蔽和静音而已。

对此,Ravikant在Airchat上解释,会把”尽可能多的审核工具交到用户手中。他认为Airchat应该像晚宴一样运作——你不会因为有人参与文明辩论就把他们赶出家门。但如果他们开始对你大声尖叫,明智的做法是进行干预。”我们不想审查内容,但我们会审查语气”,Ravikant说。

那么如果有人冒充或泄露其他人的个人信息呢?这看起来挺棘手,但对于这两位功成名就的硅谷大佬来说,似乎并不是需要立即考虑的问题。眼下制造一个新的沟通范式,引领一轮风靡的社交潮流,在历史上留下一笔就足够了。不论昙花一现还是持久运行,二人都是佛系的边走边看。

Ravikant曾如此形容这款应用,“我想要一个口袋里的家庭聚会。我想随时都能掏出手机,和有趣、讨人喜欢、机智的人聊天。”

在Airchat重新对iOS用户开放的周日晚上,Ravikant 也发布了一条语音信息:“天啊,我得去睡觉了”,声音透着无尽疲惫,“但我正在这里进行着最精彩的对话。”

(Airchat 现已对美国和欧洲用户开放注册,感兴趣的小伙伴可以下载体验,其他地区仍需邀请链接~)

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

AI 音乐,会不会诞生下一个「抖音」?

音乐创作从此触手可及。

作者 | 连冉
编辑 | 郑玄

AI 音乐最近火到发烫。


首先是三月下旬,美国 AI 初创公司 Suno 发布 V3 音乐生成模型,该模型能够在几秒钟内根据输入的提示词生成两分钟的高质量音频,惊艳的效果让行业相信 AI 音乐已经迎来了自己的「ChatGPT 时刻」。

紧接着,一个月后,国内的昆仑万维宣布推出「天工SkyMusic」音乐生成大模型,其评分超越 Suno V3,成为 AI 音乐生成模型最新 SOTA(State of the Art,指当前技术在本领域技术指标全球第一)。

这引起了极客公园的好奇。客观来说,今天中美在 AI 大模型的基础研发上还存在着一定差距。即使细分领域的垂直模型,如此自信地宣称全球领先的团队并不多见。

此外,音乐作为多模态领域中的重要组成部分,有着不菲的产业价值。全球录制音乐市场一年的总收入近 300 亿美元,而相关的演唱会、BGM、KTV 和线上的短视频、K 歌平台等更是每年数千亿美元的市场规模。AI 的介入必然带来生产侧和消费侧的全面革新,其潜在影响不会亚于数字音乐和流媒体的兴起。

因此在 4 月 17 日「天工SkyMusic」正式上线后,我们第一时间下载并体验了这款软件。以下是我们的体验感受,以及对 AI 音乐未来发展的一点想法。

01/「天工SkyMusic」:
一段歌词,几秒生成
三首不同风格的歌曲

从产品设计角度来看,「天工SkyMusic」与「Suno V3」在多个方面相似,但在一些关键细节上还是有明显的不同。

使用「天工SkyMusic」生成音乐,需要输入歌名、歌词,同时可以通过添加段落信息,比如「主歌」、「副歌」、「前奏」等进行微调——这些都与 Suno 的操作相似。

两者最大的不同在于:Suno 要求用户输入歌曲风格,如流行、爵士或说唱;而「天工SkyMusic」则允许选择参考曲目,可以来自其他用户上传过的歌曲,也支持自己上传。

这个功能非常有用。一方面,相比于泛泛的「风格」,「曲目」提供了更精确的定向,这更有助于生成自己想要的音乐。

从实际使用体验来看,如果缺少专业乐理训练,普通用户很难精准描述歌曲风格——想象一下,该用什么语言描述《夜的第七章》?因此,像「天工SkyMusic」这样能够在浏览并倾听原音乐时找到与自己歌词契合的风格,这比使用自然语言描述能够更好地表达音乐需求,也更契合普通用户的音乐创作的场景。

输入歌词、歌名和参考曲目以后,就可以直接生成音乐。「天工SkyMusic」会一次性生成三首风格、唱腔略有不同的歌曲——这是一个很实用的产品设计。不论是「Suno V3」还是「天工SkyMusic」,尽管今天 AI 音乐虽然已经能生成出一定水准的音乐,但稳定性还有待提升,三首里往往只有一首还算不错,而想要得到更好的音乐,除了需要做好歌词分段等微调,更需要反复尝试。

除了写好歌词生成歌曲以外,「天工SkyMusic」也支持 AI 写词。如上所示,上面这首《夏天的风》就是我们用「AI 写词」和「生成歌曲」完成创作的歌曲。这首歌的旋律还不错,但由于没有给歌词分段,整首歌听下来缺少了一点音调变化。

我尝试在苏轼的《水调歌头》里加上分段,这次生成的歌曲就有了明显的情感变化,尤其是唱到「人有悲欢离合,月有阴晴圆缺」这样的副歌高潮段落时,感染力十足。

如果生成了满意的歌曲,用户还可以选择「投稿」发布到「天工SkyMusic」平台,以及支持分享到其他社交媒体平台。在首页,我听了一些点赞比较多的热门生成音乐,其中不乏一些质量上乘的作品,乍一听几乎无法辨别其为 AI 生成——当然仔细分辨的话,还是能在一些细节处理上看到与专业作品的差距。

事实上,许多专业音乐人对「天工SkyMusic」也有不低的评价。例如,B 站 UP 主 @Metalion,一名职业音乐人,他尝试了用自己的旧歌词生成,并试听了主页其他人发布的热门 AI 歌曲,其中有好几首都给出了「还不错」、「像是一首完整的歌曲」这种不低的评价。

整体体验下来,我感觉「天工SkyMusic」的音乐生成能力至少在音乐初学者以上,但生成速度远不是人类可比,而且大量的音乐作品中不乏一些相对完整甚至局部惊艳的优秀作品。当然,目前 AI 音乐模型的能力还无法实现整首歌曲从头到尾都保持稳定品质,也无法像真正的音乐人那样细致打磨作品。

然而,就目前的技术水平而言,「天工SkyMusic」已是一款能为用户带来实际价值的优秀产品。通过降低音乐创作门槛,如「模仿曲目」、「一次生成三首」和「选择发布」这些细节设计,大模型已经可以让普通人也能够轻松享受创造音乐、分享音乐的快乐,人人都能以歌明志。

而随着大模型继续迭代,产品和功能继续丰富,未来一两年,AI 音乐还有更多的可能性。

02/AI 音乐,会走向何方

谈完对产品的体验,最后我们来聊聊基于这次体验,我们可以看到的一些对 AI 音乐行业未来发展的观察。

在「天工 3.0」和「天工SkyMusic」的媒体沟通会上,昆仑万维董事长兼 CEO 方汉在接受媒体采访时说,他认为 AI 音乐创作工具未来会有两个分化:面向 PGC 和面向小白的 UGC 用户。UGC 基本上是一键生成,方便为主;PGC 就相对复杂,「天工SkyMusic」也会在后续加入曲调调整等更专业的音乐工具。

「天工SkyMusic」这样的产品,今天对 UGC 和 PGC 而言都有一定的价值,并在可预见的未来,技术会向两个不同的方向持续迭代。

对于普通 UGC 用户,AI 音乐生成主要提供的还是娱乐价值。音乐创作是情感表达的一种形式,即使是非专业人士也有创作的需求。以往,技术门槛如词曲创作和音乐理论是主要障碍,而 AI 技术的引入,相当于为他们提供了一个强大的「音乐创作外骨骼」,使得任何人都能创作出心中所想的音乐并通过社交媒体进行分享。

当然,当前 AI 音乐平台操作依然复杂,用户需手动进行歌词分段和微调,且生成的音质不够稳定。而随着技术的持续迭代,这些问题相信很快就会得到解决。正如微博和抖音在文章和视频创作领域所引发的革命一样,一个去中心化的音乐创作平台可能将彻底改变人们的音乐创作和消费方式。

对于专业人士的 PGC 用户而言,尽管今天的 AI 音乐工具尚不能完全替代人类创作者,但已经开始成为一个极具价值的辅助工具。

首先是创意激发。目前 AI 音乐大模型创作稳定性还不够,但是速度快,对于陷入瓶颈的创作者,AI 可以成为一个很好的创意启发工具。方汉也列举了一个技术团队与专业创作者沟通后的场景,他们认为「天工SkyMusic」有一个特别有价值的地方:就是跨区域风格灵感激发。例如,中国音乐人通常对非洲和拉美音乐不甚了解,但通过使用「天工SkyMusic」,他们可以轻松探索并融合这些异域文化的曲调,从而在创作中获得新的灵感。

还有一个很有价值的场景在于小样。在很多商务创作的沟通场合,尤其是一些音乐人和非音乐人的沟通(比如做广告 BGM 时,编曲和广告主沟通),很大的麻烦在于如何对齐双方对作品方向的理解。而有了 AI 之后,可以很容易地生成一个相对精准地小样儿,这能节省大量的沟通时间以及降低后续返工的风险。

从实用性的角度来看,今天需要用到音乐的行业非常多,比较典型的就是短视频、影视和游戏制作,而传统音乐创作不仅成本高昂还费时费力,把 AI 引入到这些行业的音乐生产流程,任何效率的提升都有可能带来巨大的产业价值。

在内容创作领域,谁能最快适应技术变革,谁就可能获得最大的利益,这一点在短视频领域已经有过验证。随着手机摄像头、5G、以及视频剪辑 APP 的崛起,视频拍摄制作门槛不断降低,最终伴随着抖音的全球走红,短视频赛道全面崛起,拉开一场新时代的大幕。

而今天,在 AI 音乐乃至所有 AIGC 平台上,历史可能再次重演。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

AI 音乐,会不会诞生下一个「抖音」?

音乐创作从此触手可及。

作者 | 连冉
编辑 | 郑玄

AI 音乐最近火到发烫。


首先是三月下旬,美国 AI 初创公司 Suno 发布 V3 音乐生成模型,该模型能够在几秒钟内根据输入的提示词生成两分钟的高质量音频,惊艳的效果让行业相信 AI 音乐已经迎来了自己的「ChatGPT 时刻」。

紧接着,一个月后,国内的昆仑万维宣布推出「天工SkyMusic」音乐生成大模型,其评分超越 Suno V3,成为 AI 音乐生成模型最新 SOTA(State of the Art,指当前技术在本领域技术指标全球第一)。

这引起了极客公园的好奇。客观来说,今天中美在 AI 大模型的基础研发上还存在着一定差距。即使细分领域的垂直模型,如此自信地宣称全球领先的团队并不多见。

此外,音乐作为多模态领域中的重要组成部分,有着不菲的产业价值。全球录制音乐市场一年的总收入近 300 亿美元,而相关的演唱会、BGM、KTV 和线上的短视频、K 歌平台等更是每年数千亿美元的市场规模。AI 的介入必然带来生产侧和消费侧的全面革新,其潜在影响不会亚于数字音乐和流媒体的兴起。

因此在 4 月 17 日「天工SkyMusic」正式上线后,我们第一时间下载并体验了这款软件。以下是我们的体验感受,以及对 AI 音乐未来发展的一点想法。

01/「天工SkyMusic」:
一段歌词,几秒生成
三首不同风格的歌曲

从产品设计角度来看,「天工SkyMusic」与「Suno V3」在多个方面相似,但在一些关键细节上还是有明显的不同。

使用「天工SkyMusic」生成音乐,需要输入歌名、歌词,同时可以通过添加段落信息,比如「主歌」、「副歌」、「前奏」等进行微调——这些都与 Suno 的操作相似。

两者最大的不同在于:Suno 要求用户输入歌曲风格,如流行、爵士或说唱;而「天工SkyMusic」则允许选择参考曲目,可以来自其他用户上传过的歌曲,也支持自己上传。

这个功能非常有用。一方面,相比于泛泛的「风格」,「曲目」提供了更精确的定向,这更有助于生成自己想要的音乐。

从实际使用体验来看,如果缺少专业乐理训练,普通用户很难精准描述歌曲风格——想象一下,该用什么语言描述《夜的第七章》?因此,像「天工SkyMusic」这样能够在浏览并倾听原音乐时找到与自己歌词契合的风格,这比使用自然语言描述能够更好地表达音乐需求,也更契合普通用户的音乐创作的场景。

输入歌词、歌名和参考曲目以后,就可以直接生成音乐。「天工SkyMusic」会一次性生成三首风格、唱腔略有不同的歌曲——这是一个很实用的产品设计。不论是「Suno V3」还是「天工SkyMusic」,尽管今天 AI 音乐虽然已经能生成出一定水准的音乐,但稳定性还有待提升,三首里往往只有一首还算不错,而想要得到更好的音乐,除了需要做好歌词分段等微调,更需要反复尝试。

除了写好歌词生成歌曲以外,「天工SkyMusic」也支持 AI 写词。如上所示,上面这首《夏天的风》就是我们用「AI 写词」和「生成歌曲」完成创作的歌曲。这首歌的旋律还不错,但由于没有给歌词分段,整首歌听下来缺少了一点音调变化。

我尝试在苏轼的《水调歌头》里加上分段,这次生成的歌曲就有了明显的情感变化,尤其是唱到「人有悲欢离合,月有阴晴圆缺」这样的副歌高潮段落时,感染力十足。

如果生成了满意的歌曲,用户还可以选择「投稿」发布到「天工SkyMusic」平台,以及支持分享到其他社交媒体平台。在首页,我听了一些点赞比较多的热门生成音乐,其中不乏一些质量上乘的作品,乍一听几乎无法辨别其为 AI 生成——当然仔细分辨的话,还是能在一些细节处理上看到与专业作品的差距。

事实上,许多专业音乐人对「天工SkyMusic」也有不低的评价。例如,B 站 UP 主 @Metalion,一名职业音乐人,他尝试了用自己的旧歌词生成,并试听了主页其他人发布的热门 AI 歌曲,其中有好几首都给出了「还不错」、「像是一首完整的歌曲」这种不低的评价。

整体体验下来,我感觉「天工SkyMusic」的音乐生成能力至少在音乐初学者以上,但生成速度远不是人类可比,而且大量的音乐作品中不乏一些相对完整甚至局部惊艳的优秀作品。当然,目前 AI 音乐模型的能力还无法实现整首歌曲从头到尾都保持稳定品质,也无法像真正的音乐人那样细致打磨作品。

然而,就目前的技术水平而言,「天工SkyMusic」已是一款能为用户带来实际价值的优秀产品。通过降低音乐创作门槛,如「模仿曲目」、「一次生成三首」和「选择发布」这些细节设计,大模型已经可以让普通人也能够轻松享受创造音乐、分享音乐的快乐,人人都能以歌明志。


02/AI 音乐,会走向何方

谈完对产品的体验,最后我们来聊聊基于这次体验,我们可以看到的一些对 AI 音乐行业未来发展的观察。

在「天工 3.0」和「天工SkyMusic」的媒体沟通会上,昆仑万维董事长兼 CEO 方汉在接受媒体采访时说,他认为 AI 音乐创作工具未来会有两个分化:面向PGC和面向小白的UGC用户。UGC 基本上是一键生成,方便为主;PGC 就相对复杂,「天工SkyMusic」也会在后续加入曲调调整等更专业的音乐工具。

「天工SkyMusic」这样的产品,今天对 UGC 和 PGC 而言都有一定的价值,并在可预见的未来,技术会向两个不同的方向持续迭代。

对于普通UGC用户,AI音乐生成主要提供的还是娱乐价值。音乐创作是情感表达的一种形式,即使是非专业人士也有创作的需求。以往,技术门槛如词曲创作和音乐理论是主要障碍,而 AI 技术的引入,相当于为他们提供了一个强大的「音乐创作外骨骼」,使得任何人都能创作出心中所想的音乐并通过社交媒体进行分享。

当然,当前 AI 音乐平台操作依然复杂,用户需手动进行歌词分段和微调,且生成的音质不够稳定。而随着技术的持续迭代,这些问题相信很快就会得到解决。正如微博和抖音在文章和视频创作领域所引发的革命一样,一个去中心化的音乐创作平台可能将彻底改变人们的音乐创作和消费方式。

对于专业人士的PGC用户而言,尽管今天的AI音乐工具尚不能完全替代人类创作者,但已经开始成为一个极具价值的辅助工具。

首先是创意激发。目前 AI 音乐大模型创作稳定性还不够,但是速度快,对于陷入瓶颈的创作者,AI 可以成为一个很好的创意启发工具。方汉也列举了一个技术团队与专业创作者沟通后的场景,他们认为「天工SkyMusic」有一个特别有价值的地方:就是跨区域风格灵感激发。例如,中国音乐人通常对非洲和拉美音乐不甚了解,但通过使用「天工SkyMusic」,他们可以轻松探索并融合这些异域文化的曲调,从而在创作中获得新的灵感。…



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Perplexity AI获6270万美元融资,估值10.4亿美元

4月24日,生成式AI平台Perplexity AI在社交平台宣布,获得6270万美元融资,估值10.4亿美元。本次由Daniel Gross领投,Stan Druckenmiller、NVIDIA、Jeff Bezos、Tobi Lutke、Garry Tan、Andrej Karpathy等跟投。


Perplexity AI是一家提供生成式AI搜索引擎服务,支持用户通过自然语言搜索任何信息,可以把Perplexity AI看成搜索引擎版的“ChatGPT”。
目前,已推出了web版和移动版服务,并且支持中文提示。
体验地址:https://www.perplexity.ai/discover

根据资料显示,Perplexity AI创立于2022年8月,同年9月获得310万美元种子轮融资,12月发布问答引擎“Ask”,随后其业务实现飞速增长。
仅用4个月,月活用户便突破200万成为生成式AI搜索引擎领域的一批黑马,这也是能获得微软、谷歌、GitHub等科技大佬投资的重要原因之一。
产品方面,Perplexity AI不仅提供web搜索服务,还推出了面向移动端的iOS应用Perplexity - Ask Anything。
Web搜索:用户可以直接在搜索框进行提问,例如,“如何治疗偏头痛”,会为用户列出治偏头痛的各种方法,并提供这些信息的来源和相关新闻等,点击链接即可跳转到源页面。还支持多层次连续提问,直到得到满意答案为止。

移动应用搜索:功能上与Web搜索几乎差不多,还支持语音提问、查看热门话题、保留历史搜索记录功能。

Perplexity AI表示,像ChatGPT这种问答模式彻底颠覆了应用的交互模式,简化了大量手动业务,使人们获取信息的方式更加便捷、广阔。同时这也为Perplexity AI提供了机会,通过智能技术创新向传统搜索引擎发起挑战。
素材来源:Perplexity AI,如有侵权请联系删除



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Microsoft将与韩国科技巨头建立人工智能合作伙伴关系

Microsoft计划于下个月与韩国领先科技公司的高管会晤,以加强其人工智能合作伙伴关系。图片{ width=50% }


这一高层会议被称为”2024微软首席执行官峰会”,将于2024年5月14日举行,由微软创始人比尔·盖茨和董事长兼首席执行官萨提亚·纳德拉参与,他们将与三星的Kyung Kye-hyun、SK海力士的Kwak Noh-jung、LG电子的Cho Joo-wan以及SK电信的Ryu Young-sang展开闭门讨论。

据韩国《韩国经济日报》的消息来源透露,微软计划在各个领域探讨人工智能技术的联合企业。与三星和SK海力士的讨论可能集中在联合开发和供应人工智能芯片上。三星和SK海力士被公认为世界领先的存储芯片制造商,可以通过下一代技术(如高带宽内存(HBM)人工智能芯片和固态硬盘(SSD))增强微软的服务器能力。

与LG电子的合作主题将包括将人工智能技术整合到家电产品中,这将提升微软在与谷歌和Meta等竞争对手之间的竞争优势。与SK电信的合作则预计将进一步挖掘云和5G服务。此次会议的时机恰到好处,因为全球科技行业正加大对人工智能开发的关注。通过将微软的人工智能服务潜在地整合到三星智能手机和LG家电等产品中,微软有望显著提升其市场地位。

三星的设备解决方案Kyung上个月表示,他们的新一代人工智能加速器Mach-1和Mach-2将很快投入批量生产。这些加速器旨在优化GPU和HBM芯片之间的协同作用,承诺实现处理速度的革命。本月初,该公司还推出了行业首款LPDDR5X DRAM,旨在提升设备上的人工智能。

在SK电信的Ryu领导下,该公司牵头组织了全球电信人工智能联盟(GTAA)。该联盟包括德国电信和新加坡电信等全球主要参与方,旨在在全球超过13亿客户基础上开发人工智能基础设施和生成式人工智能服务。

去年,SK电信向人工智能初创公司Anthropic投资了1亿美元,致力于开发专为电信运营商打造的大型语言模型(LLM)。这一合作项目延伸到了GTAA发起的正在进行的电信人工智能平台项目中。

2024微软首席执行官峰会为增进人工智能合作与技术进步提供了机会,巩固了微软在行业中的关键地位。

[图片来源 Natalia Pedigo]

相关:Meta推出开源Llama 3 LLM,提升竞争力

想从行业领袖那里了解更多关于人工智能和大数据的知识吗?欢迎参加在阿姆斯特丹、加利福尼亚和伦敦举办的人工智能和大数据博览会。该综合性活动与其他主要事件同期举行,包括BlockX、数字转型周和网络安全与云博览会。

探索其他由TechForge提供的未来企业技术活动和网络研讨会。


注意:Title、Date、Body部分内容已经放入了对应位置。最终输出为Markdown源文件格式内容。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Crowdbotics, Microsoft共同利用CodeOps加速应用程序开发

公告与Crowdbotics的CodeOps平台正式上线同时宣布新合作伙伴关系
Crowdbotics,作为软件开发的新标准方法论CodeOps的先驱者,今天宣布与微软展开新的合作关系。图片{ width=60% }


微软将其在云服务和人工智能领域的专业知识带入到这一合作中,而Crowdbotics则分享其在CodeOps方面的领导力,这是一种通过系统性代码复用加速应用开发的新型基于人工智能的方法。这两家公司将携手帮助客户大幅提高在Microsoft Azure上构建新企业应用的速度和效率。
博客文章:Crowdbotics CodeOps平台及与微软的新合作:利用人工智能构建软件
此外,Crowdbotics还宣布其CodeOps平台正式上线,这是一种基于人工智能的解决方案,通过在客户现有的DevSecOps流程之上构建来实现系统性代码复用。Crowdbotics平台帮助客户充分利用他们已经编写的代码,并帮助他们避免重复发明轮子。该平台利用人工智能加速开发生命周期的每一步,从改进产品需求文档(PRD)流程开始,一直延伸到部署,为客户带来实际效益。通过实现系统性代码复用的承诺,Crowdbotics平台加速了价值交付的时间,降低了企业应用开发的风险。
“微软以与那些展示开发新型独特AI用例能力的公司合作而著称,这次合作有助于验证我们的CodeOps平台的强大力量,”Crowdbotics创始人兼首席执行官Anand Kulkarni表示。“这种合作关系,再加上我们旗舰CodeOps平台的正式上线,使组织能够获得加快应用开发速度所需的工具,这样他们就可以专注于其他创新领域。”
“与Crowdbotics合作让我们能够为客户提供更多开发应用程序的选择,同时节约时间和资源,”微软全球合作伙伴解决方案总经理Gustavo Blum表示。“Microsoft Azure及我们在人工智能方面的投资,再加上Crowdbotics对系统性代码复用方法论的结合,为客户提供了一套新的、强大的工具集,用于推动数字化转型并构建能够推动业务发展的应用。”
由于此次合作,客户将获得Microsoft和Crowdbotics两者结合使用AI简化应用程序开发的最佳选择。
Crowdbotics CodeOps平台
Crowdbotics CodeOps平台已正式上线,它建立在实际情况之上,即平均而言,给定项目所需的代码高达70%已经被编写。使用Crowdbotics CodeOps平台进行开发包括四个关键步骤:
1. 规划。利用人工智能改进需求定义流程的质量,提供考虑基础设施、标准和政策的高质量产品需求文档(PRDs)。
2. 匹配。复杂的人工智能将PRD中捕获的每个应用需求细节与维护在中央模块目录中的现有代码进行匹配。
3. 组装。使用匹配过程中识别的模块,平台利用人工智能将它们组装成一个几乎完整的应用。
4. 部署。开发人员填补任何剩余的空白,专注于最独特和有价值的功能。
Crowdbotics CodeOps平台使组织摆脱使用生成式人工智能来重新发明轮子,而是利用其力量促进更快、更具创新性的应用程序开发。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Arhasi的机密礼宾重新定义AI Chatbot安全性

Arhasi,一家专注于AI安全性和治理的精品初创公司,今天推出了其突破性服务:Confidentiality Concierge。图片{ width=60% }


Arhasi提供两个版本的服务:一个免费供民主使用的试验场,以及一个专用企业解决方案,为组织的数据提供高级定制级别的保护。Confidentiality Concierge旨在显著增强聊天机器人、AI代理和Microsoft Teams等协作平台的GenAI安全姿势管理,确保它们对各种威胁(包括LLM提示注入、网络钓鱼、数据泄露等)保持弹性。

基于Arhasi强大的R.A.P.I.D平台构建的Confidentiality Concierge向用于生成式AI应用的Large Language Models(LLMs)提供全面的安全协议扩展。通过遵守严格的标准,如ATLAS MITRE、NIST AI、OWASP以及各种ISO/IEC指南,Arhasi赋予组织维护最高级别的数据保护能力——特别是对个人身份信息(PII)和健康信息(PHI)等敏感信息——同时保持运行效率。

在传统数据安全措施不足的世界中,Arhasi提供实时保护,并建立严格的防范措施,以防止未经授权的访问和数据泄露。随着LLMs越来越多地精细调整各种企业数据,可靠的安全机制变得至关重要。Arhasi的解决方案旨在不仅抵御传统威胁,还能够阻止诸如LLM越狱、模型攻击、恶意代码执行、未加密凭证泄露、LLM插件 compromise、对抗性数据攻击以及专题攻击等复杂攻击。

插图场景:在这里,HR员工Amanda正在与公司的AI chatbot 互动,询问最近招聘产品经理岗位的某人的工作地点和薪资。Amanda在组织中的职位授予她“特权用户访问”的权限,根据公司IAM政策为此服务指定。这使她可以选择启用或禁用安全性,从而能够访问文件预览以及识别/去识别信息,如果她选择的是默认的“非特权用户访问”,则会启用并且不可更改所有的安全指南和防范措施,保护所有个人信息并且仅提供去识别数据。在这里,她选择在与chatbot的对话中启用安全性。由Arhasi的Confidentiality Concierge 提供支持的 chatbot 聪明地拒绝透露这些敏感信息,展示其保护机密企业数据的能力。稍后,当Amanda请求chatbot从HR代表的角度起草一封给公司总裁关于同一职位的电子邮件时,系统能够熟练地起草电子邮件,但去识别敏感信息,以确保合规性和安全性不会被破坏。Arhasi的首席AI官员Chiru Bhavansikar在发布会上表示:“将Confidentiality Concierge集成到您的GenAI工作流程中,不仅可以加固应用程序防范攻击,还能够在您的AI互动体系中嵌入信任和安全性。我们对设定负责任的AI发展新标准并确保这些创新可获得且安全性的前景感到兴奋。”Arhasi的Confidentiality Concierge与领先的云服务和AI模型(包括Azure OpenAI Service、Google VertexAI、AWS Bedrock 和 HPE Greenplum)无缝兼容,并支持ChatGPT、Google Gemini、Mistral 和 Titan等主要LLMs。该服务的广泛集成能力包括ServiceNow、Active Directory 和 Salesforce 等平台,为所有基于AI的操作提供多功能性和安全性环境。通过与Cloudbench、Alteryx、GTS Technology Solutions 和 HPE等行业领导者的合作,Arhasi确保客户持续访问Confidentiality Concierge的高级企业版本和R.A.P.I.D平台。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

MulticoreWare加入瑞萨R-Car联盟

MulticoreWare Inc,一家领先的全球技术公司,提供软件产品、解决方案和工程服务,很高兴宣布已加入瑞萨R-Car联盟。图片{ width=60% }


该联盟是一个动态平台,旨在让领先的行业领导者,与瑞萨R-Car SoC开发者在连接汽车、ADAS和网关市场内进行合作和创新。作为合作伙伴,MulticoreWare独特地能够提供专业知识和先进解决方案,如先进的3D感应、影像雷达与ISP调校、人工智能/机器学习模型和框架,以推动中间件/应用程序、系统集成和咨询的进步。
MulticoreWare移动与交通事业部副总裁兼总经理Vish Rajalingam表示:“MulticoreWare很高兴与瑞萨合作,将我们在优化和定量化AI模型方面的专业知识,应用于计算密集型的ADAS和车内应用于R-Car联盟。在AI部署之外,我们团队在嵌入式软件与RTOS、雷达数据处理和相机ISP调校方面的优势将使我们能够将创新转化为在瑞萨SoC上高性能的实际用例。”
R-Car联盟营造了一个多功能且多元化的合作环境,将系统集成商、中间件/应用程序开发人员、操作系统和工具供应商聚集在一起。瑞萨,作为汽车半导体领域的全球领先者,提供高度可靠和技术先进的SoC,配备全面的开发援助。这确保了客户可以获得完全符合其需求的解决方案。联盟成员从 获得评估板和软件,有助于共同开发先进解决方案。
瑞萨人工智能与云副总裁Mandali Khalesi表示:“非常高兴欢迎MulticoreWare加入R-Car联盟。MulticoreWare团队在AI优化、模型集成和在R-Car V4H平台上部署方面展现出了丰富的经验。我期待MulticoreWare在AI和嵌入式软件领域继续支持瑞萨和我们的客户。”



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

为什么说AI Agent的机会在To B?

文章来源:飞哥说AI

作者 | 高佳 王艺

Agent 诞生短短一年,已成为科技巨头与创业公司多方角逐的兵家必争之地。而市场上的大多数 Agent,似乎并不严格符合商业界对于 Agent 的期待。


包括 OpenAI 的 GPTs,其实只是用于特定知识库或数据的 Chatbot。这些基于场景信息、用于数据分析、代码纠错的智能体,不过是一种轻量化的个人助手而已。除了大家一直关注的软色情、假官方、刷单横行等安全问题之外,更因缺乏必要的用户群需求和场景的汇聚深入,使得To C领域并未出现颠覆式的杀手级应用,很多 GPTs 沦为了大…

图片来源:由GPTNB生成

Website: https://www.aixinzhijie.com/article/6845506



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB