Figure AI 但愿通过制制和使用机械人来削减人力劳动力,并填补“人类不想处置的工做”,从而处理美国日益严沉的劳动力欠缺问题。
Photoroom是一款人工智能图像编纂软件,努力于为电子商务、内容创做者和小型企业供给高效、专业的图像处置东西,帮帮用户快速生成专业级的产物图片、社交封面和小我头像等。
该框架通过模块化组件,简化了取LLM的交互,支撑取外部数据源、API和办事的集成,使得开辟者可以或许快速建立复杂的AI使用。
而现在,Abridge正操纵AI强力的模子和算法,逐步代替了这一职业。相较于保守的转员25美元/小时的成本,AI的成本以0。12美元/小时的成本大幅度降低了人力成本。
AI医疗赛道上最具代表性的公司该当就是Abridge了,它是一款AI医疗笔记软件,操纵AI模子,将患者和临床大夫的对话语音进行,并拾掇成特定格局的医疗抄写笔记。
其下的旗舰产物 Figure 02 是一款具备语音对话、视觉推理和高矫捷度机械手的机械人,已正在宝马南卡罗来纳州的工场中投入利用,施行拆卸等使命。
Luminance能够快速阐发大量文档,识别潜正在的法令风险和条目,从而大大削减人工审查所需的时间和精神。此外,Luminance还供给智能化的合规查抄,帮帮企业确保其合同和营业勾当合适相关律例和政策。
正在2024年6月完成8000万美元的B轮融资后,PikaLabs目前的估值为4。7亿美元,有报道称潜正在估值高达7亿美元。
Perplexity AI 能够通过从动收集、阐发和总结来自当前来历、学术论文和靠得住数据库的数据来简化研究和消息检索。它对于需要快速、靠得住谜底而无需手动筛选多个来历的学生、研究人员、记者和专业人士很是有用。
正在金融办事、法令和征询等专业办事范畴中,无效查找消息的能力尤为主要,很多查询拜访流程需要对大量稠密文档进行手动阐发。
Midjourney是一款AI图像生成办事的软件,正在浩繁的AI图像生成软件中,它侧沉于将基于文本的提醒转换为活泼的视觉图像。
声音克隆:用户只需要上传30秒到5分钟摆布的声音,就能够间接复制这小我的声音,包罗音色、腔调以至情感都能克隆出来。
依托自研的强大模子,Captions还能够生成由AI创制的口播虚拟人,被评价为“让AI视频对口型时代竣事”,将虚拟人对口型手艺带入到2。0时代。
语音和文字双向转换:不只是将文字转换成声音,ElevenLabs还能够进行声音,实现文本和语音的双向转换。
目前,有跨越10万家全球企业(包罗50%的500强企业)利用过DeepL的办事,包罗Zendesk、日经旧事、Coursera和铁等出名企业。
取保守的为特定使用设想的机械人分歧,Skild Brain旨正在做为一个共享的通用大脑,可以或许配备各类机械人,使其正在分歧场景中施行多种使命。
言语进修大致可分为“传闻读写”四个部门,大大都母语进修者老是会从听和说来进修和控制言语。Speak操纵AI来模仿母语者的进修思,将进修过程分为三个部门。
第一,AI 从“聊天”“施行”:2025年是AI使用的分水岭。过去AI多是回覆问题、生成内容的东西,而现正在它起头实正「干事」——完成完整的工做流程。AI不再只是「帮手」,而是「施行者」。
StackBlitz是一个基于浏览器的集成开辟(IDE),答应开辟人员间接从其Web浏览器建立、运转和摆设全栈Web使用法式。
Captions是一个AI驱动的视频编纂和内容建立平台。努力于为创做者供给一坐式的“谈话视频”制做取编纂处理方案,旨正在简化从脚本撰写、到编纂、发布的全流程视频制做。
LangChain的设想方针是使LLM不只可以或许处置文本生成使命,还能取外部数据源和办事进行交互,实现更复杂的使用逻辑。
Photoroom还专注于从无到有建立本人的模子,取其他AI视觉平台比拟,为用户生成图像的速度提高了40%。
用户只需要上传一个5秒以上的视频,然后再上传一张照片,通过写提醒词,就能够将照片以特定的体例天然地融入到视频里。并且很是逼实,没有高耸感。
这时,Hebbia就有了用武之地。Hebbia的成立旨正在为投资银行和私募股权阐发师供给神经搜刮功能,以便他们可以或许处理复杂和含糊其词的查询。
Skild AI是一家总部位于美国州的草创公司,公司专注于开辟人工智能“机械脑”——Skild Brain,帮帮机械人可以或许正在复杂和动态的中施行多种使命,如操控物体、和活动等。
Perplexity AI是一款AI搜刮引擎和 Web 搜刮东西,努力于开辟和供给先辈的文本生成和理解东西。
正在消息化的时代,很多公司都面对着数据过载的问题。员工每天都需要接管大量并且无序的消息,这让数据拾掇成为一件棘手的工作。很多部分的设立也会形成消息壁垒,让员工难以高效便利地去领会和操纵公司内部的学问。
出名的视频编纂软件剪映因其“大而全”的产物定位,反到会不易正在一些场景大展身手。而Captions从打口播等短视频,帮帮用户改善口播人脸色不天然、眼神飘忽等问题。涵盖字幕生成、AI眼神矫正等多个功能,帮帮口播新手表示更为天然。
起首,用户起首辈行听力和白话的,接着,Speak将会频频锻炼用户控制新进修到的词汇或短语,最初,操纵AI模仿出实正在的使用语境,让用户设身处地地舆解,言语和词汇的利用。
此中,除了Perplexity如许耳熟能详的公司外,也出现出了一批新的AI使用公司,好比帮帮工程师编写代码的AI编程公司Anysphere(旗下AI产物为Cursor)、AI言语使用公司Speak等等。
2025年1月,AI编程公司StackBilitz完成了新一轮融资,融资金额跨越1亿美元。同时,公司颁布发表,注册用户冲破了200万。
Synthesia是一款领先的AI视频生成平台,通过AI生成逼实的语音和脚色视频,支撑100多个分歧类型的AI虚拟人和120多种言语。开创了用户不需要任何的摄影设备就能够生成虚拟人物的先河。
取GPT等通用AI模子分歧,该模子正在跨越1。5亿份颠末验证的法令文件(此中很多公开的)长进行了锻炼。这种特定于范畴的方式可确保法令专业人士的高精确性和靠得住性。
2023年,《瞬息全》斩获奥斯卡包罗最佳影片正在内的七项大。这部科幻片子里面有大量的特效,而视觉结果团队仅有5人!
Luminance是一家领先的英法律王法公法律手艺公司,从2016年以来聚焦于法令AI产物研发,特地为合同办理、审查和构和供给AI驱动的处理方案。
Suno是一款基于AI创做的音乐生成平台。用户可以或许通过简单地供给文本提醒来生成逼实的歌曲,包罗人声和乐器,或纯粹的器乐音轨。
第二,企业级AI东西成为配角:像 Harvey 如许的法令科技公司,曾经能从动处置从文件审查到客户沟通的整个法令流程,几乎能替代一整个初级律师团队。Sierra 和 Cursor 则别离正在客服和软件开辟范畴实现了从「辅帮」到「从动完成」的跃迁。
该软件能够从动识别并去除图片布景,凸起人物的从体。或者按照人物照片,快速生成逼实的布景。用户还能够操纵AI去除掉图片内不需要的物体某人物,简化了图片编纂的过程。
截至2023年1月,Vannevar Labs完成了7500万美元的B轮融资,累计融资总额跨越9000万美元。2023年,该公司已实现年收入4900万美元,并正在成立不到五年内实现盈利。
现在,ABridge取美国医疗卫生系统合做,成为医疗流程的一部门,潜力庞大。正在2025年2月完成了2。5亿美元的融资,最新估值高达27。5亿美元。
但让人尤为搅扰的是,因组织内过度利用SaaS而导致消息无序和满溢。想要找出无效的消息需要破费大量的时间。按照2022年的一项查询拜访,47%的数字工做者暗示难以找到无效施行工做所需的消息。
它们的焦点产物是Matrix。用户可以或许上传任何类型的文档,包罗PDF、演示文稿、电子邮件和图像,以指定他们但愿正在每个文档中回覆的问题,并当即以雷同于MicrosoftExcel的表格格局供给细致的看法。
Glean是一家聚焦于开辟企业AI搜刮聊器人的公司,次要办事于企业场景,将AI带入到企业的工做环节之中。
LangChain是一个开源框架,旨正在帮帮开辟者建立由大型言语模子(LLM)驱动的使用法式。
2024年12月份,该公司完成了一笔总额为7800万美元的C轮融资,使其估值达到10亿美元。
Mercor是一小我工智能驱动的聘请和人才婚配平台,通过正在整个聘请过程中操纵人工智能,帮帮公司更高效地寻找、审查和领取员工工资。
它的创始人,被称为“AI教母”的李飞飞密斯是斯坦福大学的传授。她认为,“看”和“做”由很强的交互性。只要让模子3D,它才能做3D的工作。这是模子进化的一个主要切点。
2025年4月,福布斯发布了第七届人工智能50强(AI 50)榜单。这份榜单由《福布斯》取红杉本钱和Meritech Capital联袂编制,清点了全球最具潜力的50家非上市人工智能公司。
StackBlitz灵敏地察看到机遇很少有开辟者正在浏览器内建立Web使用。为此,它们推出WebContainers手艺来处理这个问题,让Web能够建立使用。
相较于其他AI文本创做,Writer最大的劣势就是本人研发出来的狂言语模子。Palmyra中包含了1万亿个标识表记标帜,并针对分歧的范畴,如医疗、法令等方面进行了微调,让案牍愈加合适公司气概和行业基调、愈加专业和多样化。
当然,这并不是肝不的薄命故事,而是Runway联手,以很少的人力完成了炫酷复杂的特效。既实现了效率,又削减了人力成本,还能推进片子呈现结果和立异力的开辟。可谓是一箭三雕!
目前,Suno支撑风行、摇滚、平易近谣、电子等超50种曲风,以至能定制中国保守平易近乐、歌剧等小众类型曲风。色很只能用“拓展”功能基于用户上传的音频曲风生成雷同曲风的音乐。
基于OpenAI的GPT-4模子,Harvey利用天然言语,理解律师的意义,并快速生成法令论据和草案。复杂的法令流程就如许被AI正在极短时间内生成,正在法令流程上为律师供给帮帮,极大地提高了律师的工做效率。
而Glean依托100+的SaaS使用毗连,汇总公司的消息,供给更全面的成果。通过AI和企业搜刮平台WorkplaceSearch毗连到公司的内部数据源,成立企业的学问图谱,帮帮员工更好地搜刮消息。
Windll的是“确定地球上每小我的净资产”。Windll是一款专注于操纵人工智能阐发人员谍报的软件,通过度析和处置人员数据,为组织供给深切的洞察,帮帮他们更好地领会方针客户和潜正在客户,鞭策更无效的营销勾当和互动。
DeepL可以或许从动识别33种言语,并支撑通过麦克风进行语音翻译。不只是纯真的文本翻译,它还支撑pdf、ppt等格局的文件翻译。
Cursor 供给三种AI交互模式:正在Agent模式下,AI全程参取代码编写,很是适合编程新手;Edit模式则适合有编程经验的专业人士,用户控制代码节制权,AI供给辅帮;Ask模式则专注于问答,用户能够向AI征询各类编程问题。
正在美国,大夫需要记实每位患者的疗诊过程。因为工做复杂繁琐,医疗抄写员这一职位应运而生。美国大约有10万名抄写员,占到了大夫总数的10%。人力成本庞大。
Decagon次要为大型企业建立AIAgent,用于客户支撑和客户体验范畴。以往的智能客服大多是古板的机械人,而依托不竭进化的AIAgentEngine,AI可以或许实正理解客户的需求并处理问题。
除此之外,Midjourney还供给了一个曲不雅且用户敌对的界面,答应用户及时测验考试分歧的输入、样式和设置。这种互动方式使艺术家、设想师和快乐喜爱者可以或许积极参取创做过程并摸索各类艺术可能性。
Decagon的焦点产物AIAgentEngine采用生成式AI手艺,可以或许处置复杂的客户征询,供给个性化的响应,并取现有的客户支撑系统无缝集成。
Hebbia努力于建立面向金融和法令的AI软件,通过数据和消息拾掇为企业供给高级学问工做拾掇的办事。
依托自研的Chirp模子,Suno可以或许很好地满脚用户多样化的需求。而且Chirp模子不会复制现有的歌曲做品,了AI创做的奇特征和原创性。
2024年7月,Captions完成了6000万美元C轮融资,还被a16z发布的演讲提及为最会赔本的AI音视频使用之一。
2024年,公司成功完成了1。25亿美元的融资,使其估值达到 5 亿美元;用户数从1000万增加到2500万。
World Labs是一款空间智能使用,通过大型世界模子(Large World Models,简称LWM),使人工智能可以或许、用户只需要一张图,就能从动成立体结果。只需要一句线D的体例呈现正在现实世界中。
凭仗本公司研发出来的狂言语Palmyra模子,从动撰写出合适公司品牌和气概的营销案牍,为公司量身打制出富有立异的内容。
OpenEvidence是一款专为医疗专业人员设想的AI软件。它汇集了来自权势巨子医学期刊和指南的最新研究,能够帮帮临床大夫正在诊疗过程中做出快速、精确的决策。
Figure AI 是一家开辟 AI 驱动的类人机械人的机械人公司。这些双脚机械人能够正在复杂的实正在中施行物理使命,例如仓库、工场、零售店,以至家庭。
Cursor 是目前AI范畴内领先的编程东西,它可以或许将用户的天然言语指令从动转换成切确的代码,并可以或许解答编程相关的问题,同时发觉并敏捷修复代码中的Bug。
Windll梳理公共数据库以收集可能有帮于确定潜正在捐赠者可以或许捐赠几多的消息。这包罗房产价值、典质贷款、职业消息、过去的捐款等。并利用数据驱动的洞察进行受众识别、细分和参取,最终最大限度地提高收入和筹款成果。
Midjourney曾经有跨越1300万用户和2亿美元的营收,令人惊讶的是,它们的融资竟然为0!
用户只需要制定一些参数就能够从头起头生成高分辩率图像,包罗风光、肖像、动物和笼统艺术等分歧类型。而且还能进行气概迁徙,答应用户将一张图像的特征使用于另一张图像。
DeepL是一款操纵AI进行言语翻译的软件,因其优良的翻译质量和丰硕的翻译功能成为浩繁翻译使用的佼佼者。
2024年2月,该公司以5亿美元的估值筹集了4300万美元的B轮融资,由BaldertonCapital领投。
Mirage模子被称为“全球首个专为UGC内容生成而设想的AI模子”。用户仅需要输入一些消息,就能制定虚拟人的相关消息,如表面、性格、着拆等,从而生成短视频类的UGC视频。
公司专注于开辟基于大型言语模子(LLM)的对话式搜刮引擎,旨正在为用户供给精确、及时的谜底,并正在回覆中援用靠得住的收集来历。
2024岁首年月,LangChain颁布发表,它曾经正在由红杉本钱领投的A轮融资中筹集了2500万美元。
Mercor会先用AI审核求职者的消息,并通过一段约20分钟的AI视频面试来对求职者进行评估。最初快速高效为企业保举最佳的候选人,给公司供给相婚配的人才。
该公司由前地方谍报局(CIA)、局(NSA)和(DoD)官员配合创立,勤奋开辟人工智能(AI)和机械进修(ML)手艺,以应对范畴的环节挑和。
WriterLabs是一款专为企业打制的生成式AI平台,努力于企业营销。它能够帮帮团队提拔内容创做效率,确保品牌分歧性,并加快工做流程的从动化。
World Labs的焦点手艺是将输入的二维图像为可交互的三维场景,让平面图形升维到立体图形。通过建立交互式3D空间,用户能够更曲不雅地舆解和体验现实世界中的复杂场景和对象。
以“AI+视觉创做”为从线多种AI视频、图像等东西和模子。通过模子的不竭迭代和手艺的不竭立异,打制影视界此外AI视频特效。
Glean凭仗AI还可认为每个员工进行个性化搜刮,有针对性的互动。成为员工的AI帮手,加强企业内部的消息传送、提高员工之间的沟通效率。
不只如斯,它支撑多种平台(Linux/MAC/Windows/IOS/Android)跨端操做,支撑多人协做和办理。凭仗优良的同步和备份功能,让用户正在各类设备上丝滑切换和写做。是一款合用于正在小我和团队协做的强大的出产力东西。
当然,这种处置特定化的AI企业必然会有一个本人研发的AI模子,通过推理可以或许使AI的思虑决策愈加雷同于聘请者筛选简历、面试评判的体例。
Anysphere 是一家专注于从动化编码的立异企业,于2022年正在美国成立。该公司推出的明星产物是广受好评的AI代码编纂器Cursor。
2025年,Cursor完成了6。25亿美元的融资,估值达到96亿美元,由Thrive和a16z领投,Accel成为新的投资方。
现在,全球劳动力欠缺问题日益严沉,2030年估计发生8520万的国际人才缺口,形成8。5亿美元的经济丧失。这种现状为Skild AI带来了庞大的市场机遇。
不外Windll的次要营业面向非营利组织。通过供给每周刷新的靠得住的消费者财政数据,帮帮非营利组织吸引捐帮者。
公司,其模子的锻炼数据点至多比合作模子多出1000倍,这种普遍的数据锻炼有帮于实现超强的泛化能力,使机械人可以或许正在未见过的中施行使命。
Sierra是一款客户办事软件,可以或许处置客户征询、语音通话等使命,供给个性化和品牌分歧的对话体验。它专注于为企业打制对话式AI平台,旨正在提拔客户办事效率和质量。
Pika是由PikaLabs开辟的人工智能视频生成平台。操纵AI,它能够将任何人、任何内容添加到任何视频里。
Speak成立于2016年,是一款AI白话进修使用法式,次要操纵人工智能帮帮人们进修新言语。操纵OpenAI发布的Chatgpt-4模子,Speak让用户像母语者一样进修言语。
Synthesia的焦点功能是AI生成逼实的虚拟头像、AI生成天然的语音结果和制做高质量的视频内容。
Decrypt是VannevarLabs的焦点产物。Decrypt支撑去核心化的全球公共数据收集,让人难以通过拜候来历而提取数据,并通过矫捷的查询利用户可以或许快速找到取使命相关的数据以进行共享、操纵和分发。
Pika公司的就是操纵AI的生成手艺,让每小我都能创做风趣的短视频。Pika的焦点劣势正在于它可以或许处置各类创意气概(从3D动画到片子序列),同时连结1080p分辩率的高视觉质量。
Runway是一款AI视频和图像编纂软件。正在AI视频生成范畴可是妥妥的国际一哥!专业质量是其他AI视频软件所不成对比的。
凭仗EXPRESS-1模子,Synthesia打制虚拟AI抽象。这些人物从声音、腔调、脸色、动做等方面和实人越来越像,逐步恍惚虚拟和现实的边界。
Deepl依托专业言语的人工智能翻译模子供给更为精准的翻译。据引见,DeepL翻译的精确性高于最接近的敌手超出跨越3倍以上。
Clay以SaaS平台的形态工做,供给API接口和多种数据东西集成,并从动构成电子表格。从寻找客户、联系客户再到留存客户,Clay为每位客户草拟个性化的推广邮件,激发客户的乐趣和共识。
公司称,Palmyra言语大模子比ChatGPT等合作敌手愈加精确和无效。而且该模子具有更少的API价钱,降低了成本。
目前,OpenEvidence对美国医疗专业人员免费,用户只需验证身份即可利用。该平台已正在跨越7000家医疗机构和185个国度的临床大夫中获得普遍使用,成为日常临床实践中不成或缺的东西。
截至2024年中,Notion的全球注册用户已冲破1亿大关,这一里程碑不只了其产物的普遍承认,也奠基了其正在出产力东西市场的领先地位。
Notion是一款全能的出产力软件,集笔记、使命办理、数据库和协做于一体。采用模块化设想,用户能够通过“块”组合文本、图片、表格、代码、视频等内容,像叠乐高一样搭建小我笔记,建立个性化的页面和工做流。
这也就意味着使用开辟的渠道又被StackBlitz打通了一条。从此,软件开辟不再是保守开辟者的专利,任何人都能够无需进修编程和代码就能够本人创做软件。
不只如斯,该平台支撑多渠道沟通,包罗聊天、电子邮件和语音通线全天候办事。此外,Decagon还推出了DecagonVoice,来供给高保实的语音客服体验。
ElevenLabs是一家专注于人工智能语音生成和语音克隆手艺的公司,成立于2022年。它的焦点手艺能够帮帮用户快速生成天然、流利的语音内容,而且可以或许精确地仿照特定人物的声音。
目前,用户只能正在Speak长进修英语和西班牙语,打算很快推出法语。目前,Speak已具有1000多万用户,正在40多个国度开展营业。
Luminance的平台由剑桥大学的AI专家开辟,利用专有的法令狂言语模子LegalPre-trainedTransformer(LPT)来从动生成、审查和阐发法令合同。
不只如斯,依托公司内部先辈的AI模子,2024年正式推出了AI写做帮手Deepl Write Pro,用来优化和润色文本,让文本更有专业性和精确性。
OpenEvidence的内置功能十分强大,有跨越50种临床计较器,如CHA2DS2-VASc、SOFA、APACHEII等,便利大夫进行风险评估和评分。不只如斯,它还支撑多种临床场景,包罗从动生成患者手册和出院指点材料、供给细致的药物消息和用药指点等办事。
Sierra的手艺架构采用多模子组合,包罗OpenAI、Anthropic和Meta的大型言语模子,以确保消息的精确性和靠得住性。此外,Sierra引入了“监视代办署理”机制,通过及时和质量节制,削减AI“”现象,确保客户交互的可托度。
上一篇:AI手艺语音联动方案设备智能化节制使用启明云端