近日,昆仑万维携手新加坡南洋理工大学成功开发了名为 Q * 的算法,能够显着提升现有大模型的推理能力。Q * 在不同数据集上帮助小模型达到参数量比其大数十倍甚至上百倍模型的推理能力,使得模型性能大幅提升,同时显着降低了计算资源的需求,为人工智能的广泛应用带来全新可能,开创了高效智能的新纪元。
具体来说,通过定义 Path Cost 的函数和 Accumulated Reward 的函数,实现了对历史状态收益和未来期望收益的综合考虑。在实验中,Q * 帮助不同模型在各个数据集上实现了显着的准确率提升,超越了一些知名模型。
目前,Q * 的研究还处于初级阶段,仍有改进空间。未来,昆仑万维将继续深入研究,提升国产开源模型的推理能力,为人工智能技术发展带来更多可能。
欢迎大家加入AiBase交流群, 扫码进入,畅谈AI赚钱心得,共享最新行业动态,发现潜在合作伙伴,迎接未来的赚钱机遇!。
11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
2024年6月3日,昆仑万维宣布开源了一个性能强劲的2千亿稀疏大模型,名为Skywork-MoE。这个模型是在之前开源的Skywork-13B模型的基础上扩展来的,是首个完整应用并落地MoEUpcycling技术的开源千亿级MoE大模型。通过首创的非均匀TensorParallel并行推理方式,在FP8量化下,Skywork-MoE可以实现2200tokens/s的吞吐。
2024年6月3日,昆仑万维宣布开源2千亿稀疏大模型 Skywork-MoE , 性能强劲, 同时推理成本更低。Skywork-MoE 基于之前昆仑万维开源的 Skywork-13B 模型中间 checkpoint 扩展而来,是首个完整将 MoE Upcycling 技术应用并落地的开源千亿 MoE大模型,也是首个支持用单台4090服务器推理的开源千亿 MoE大模型。
今日,昆仑万维宣布,其旗舰浏览器OperaOne以及游戏浏览器OperaGX将正式接入端侧AI大模型,成为全球第一个接入端侧AI大模型的主流浏览器。2024年4月,Opera已在开发者版本浏览器中首次接入了端侧AI大模型,并进行了全面测试。用户可在侧边栏聊天中上传图片给Aria,并向其询问有关图像的问题,Aria将理解图像内容,并围绕图像及相关背景信息为用户提供答案。
5月27日,昆仑万维集团宣布,天工AI每日活跃用户已超过100万。根据QuestMobile的数据,2024年3月,天工平台的月活跃用户已达近千万,仅次于豆包与文心一言,成为国内活跃用户数第三的平台。这一增长不仅得益于其强大的技术能力归功于公司不断收集用户反馈,推出多项贴近用户使用场景的产品与功能,如AI搜索、AI音乐、AI绘画、AI写作等。
在大模型技术迅速发展的背景下,昆仑万维公司开源了一个具有里程碑意义的稀疏大型语言模型Skywork-MoE。这个模型不仅在性能上表现出色还大幅降低了推理成本,为应对大规模密集型LLM带来的挑战提供了有效的解决方案。Skywork-MoE的开源为大模型社区带来了一个强大的新工具,有助于推动人工智能领域的发展,特别是在需要处理大规模数据和计算资源受限的场景中。
昆仑万维宣布,其天工AI的每日活跃用户已突破百万大关,这一成就不仅体现了广大用户对天工AI的热情追捧,也标志着昆仑万维在AI领域的技术和产品能力得到了市场的广泛认可。自天工AI大模型推出以来,昆仑万维始终坚持以用户体验为中心,不断优化产品体验,打造出更加贴近用户使用场景的AI产品。天工3.0拥有4000亿参数,是全球最大的开源MoE大模型之一;天工SkyMusic则是中
新加坡国立大学联合加州大学圣芭芭拉分校与奥克兰大学的研究人员提出了一种名为SymbCoT的全新推理框架,旨在提升大语言模型的符号逻辑推理能力。这一框架结合了符号化逻辑表达式与思维链,极大提升了推理的质量、鲁棒性与可信度。不同LLM的影响:SymbCoT与更先进的模型之间的协同效应更为显着。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:、挑战英伟达!高绩效者在GenAI采用中更具挑战性,但通过最佳实践取得成功。
在最近的一项由北卡罗莱纳大学教堂山分校和艾伦AI研究所共同进行的研究中,人工智能的道德推理能力再次得到了令人瞩目的展现。特别是OpenAI的新型聊天机器人GPT-4o,在道德推理和提供道德建议方面,已经超越了公认的道德专家。研究人员也提醒我们,尽管AI在道德推理方面表现出色,但在实际应用中仍需谨慎对待其建议,特别是在缺乏人类监督的情况下。
苹果一出手,在手机等移动设备上部署大模型不可避免地成为行业关注焦点。目前在移动设备上运行的模型相对较小,并且消耗大量内存,这在很大程度上限制了其应用场景。如果PowerInfer-2.0能够与手机厂商进一步紧密合作,相信可以加速相关技术走出实验室,落地到各种真实场景。
Pico Library是一款利用先进的人工智能技术,为孩子编写和阅读有趣的故事的APP。它由苹果的神经引擎驱动,所有故事的创作和阅读都在你的设备上进行,无需互联网连接。该APP支持个性化故事定制,朗读功能,并能通过一次性应用内购买解锁更多功能,如个性化语音集成、无限写故事和保存故事、编辑故事和标题等。Pico Library不仅培养孩子对阅读的热爱,还支持语言发展和认知成长,是每位家长的得力助手。
SQLPilot是一个基于人工智能的SQL查询生成工具,旨在帮助用户快速生成复杂的SQL查询。它支持PostgreSQL和MySQL数据库,并且提供多种GPT模型以供选择。SQLPilot的主要优点包括不限数据库连接数量、SQL自动补全功能以及对用户隐私和数据安全的承诺。此外,它还提供了结果下载功能,并计划推出图形和图表查看结果的功能。
Twitdget是一款专注于Twitter平台的AI驱动工具,通过智能内容计划、自动化发布调度、深度分析和游戏化功能,帮助用户增加Twitter账户的参与度,优化发布流程。它还提供了一个原生图片编辑器,使得内容创作更加直观和高效。
Knowledge Graph RAG 是一个开源的Python库,它通过创建知识图谱和文档网络来增强大型语言模型(LLM)的性能。这个库允许用户通过图谱结构来搜索和关联信息,从而为语言模型提供更丰富的上下文。它主要应用于自然语言处理领域,尤其是在文档检索和信息抽取任务中。
Streamer-Sales 销冠 —— 卖货主播大模型是一个基于商品特点进行解说并激发用户购买意愿的智能模型。它通过深度理解商品特点,以生动、精准的语言为商品量身打造解说词,让每一件商品都焕发出诱人的光彩。无论是线上直播销售还是线下门店推广,这款模型都能成为销售的得力助手,提升销售效率,增强用户体验,为品牌形象加分。
Streamer-Sales 销冠 —— 卖货主播大模型是一个基于InternLM2微调而来的AI模型,能够根据商品特点进行解说,激发用户的购买意愿。它适用于线上直播销售和线下门店推广,可以显着提升销售效率和用户体验,为品牌形象加分。该模型通过智能解说,使商品细节和整体效果更加生动、精准,从而吸引消费者。
Streamer-Sales 销冠是一个基于大语言模型的智能卖货主播系统,它能够根据商品特点从激发用户购买意愿的角度出发进行商品解说。该模型在 InternLM2 的基础上通过指令微调而来,集成了 LMDeploy 加速推理,支持 ASR 语音生成文字,RAG 检索增强生成,Agent 网络查询等功能,并通过 TTS 技术生成带有感情的语音,最终生成主播数字人视频,为商品解说提供全方位的技术支持。
Cadenza是一款AI驱动的音乐制作工具,它允许用户通过简单的描述来生成专业的MIDI和弦进行。该工具能够确保和弦流畅地转换,适用于各种音乐风格,从流行到爵士。Cadenza的主要优点包括用户友好的界面、实时生成和弦进行的能力以及与各种数字音频工作站(DAW)的兼容性。价格方面,Cadenza在促销期间以30美元的价格出售,这使得它对于音乐制作人来说是一个经济实惠的选择。
Florence-2是由微软开发的高级视觉基础模型,采用基于提示的方法处理广泛的视觉和视觉-语言任务。该模型能够解释简单的文本提示,执行诸如图像描述、目标检测和分割等任务。它利用FLD-5B数据集,包含54亿个注释,覆盖1.26亿张图像,精通多任务学习。其序列到序列的架构使其在零样本和微调设置中均表现出色,证明是一个有竞争力的视觉基础模型。
Tellers是一个AI驱动的视频编辑平台,它允许用户将书面内容快速转化为视频,无需视频编辑专业知识。该平台通过使用机器学习和信号处理算法,为用户提供了一种创新和实用的方式来扩展内容的覆盖范围,提高SEO排名,触及新的社区,并提高内容的可访问性。Tellers还提供了商业版,支持企业整合和定制化服务,满足数据隐私和内部软件集成的需求。
MyTrainingPlan是一个提供个性化马拉松和半程马拉松训练计划的网站。它通过AI技术根据用户在Strava上的活动历史和当前健康状况来创建定制的训练计划。用户可以轻松调整计划以适应变化,并与之前的训练周期进行比较,以保持动力。此外,网站还提供里程统计、配速计算器和比赛倒计时等工具,帮助用户更好地准备比赛。
Licode是一个无代码平台,为构建者、企业和创业者提供了一个原生由AI驱动的网页应用创建环境。它允许用户无需编码即可轻松构建SaaS、门户、仪表板、CRM、聊天应用和表单应用。Licode内置了AI功能,用户可以随时随地在应用中启用AI提示,赋予用户即开即用的AI能力。此外,Licode还提供了预构建的UI组件、内置的认证和用户管理系统、与Stripe集成的账单管理、安全的数据库存储以及自定义业务逻辑的动作创建功能。
SEOJuice是一个AI驱动的内部链接工具,旨在简化SEO工作,通过自动化创建内部链接,帮助网站提升在搜索引擎中的排名。由Vadim个人开发,以解决手动添加内部链接的繁琐和耗时问题。SEOJuice通过AI扫描网站内容,找到合适的上下文链接和关键词,并自动添加,从而提升整个网站的SEO性能。作为一个自筹资金、独立运营的项目,SEOJuice不依赖外部投资,以用户订阅费用为运营资金。
Florence-2-large-ft是由微软开发的高级视觉基础模型,使用基于提示的方法来处理广泛的视觉和视觉-语言任务。该模型能够通过简单的文本提示执行诸如图像描述、目标检测和分割等任务。它利用FLD-5B数据集,包含54亿个注释,覆盖1.26亿张图像,实现多任务学习。模型的序列到序列架构使其在零样本和微调设置中均表现出色,证明其为有竞争力的视觉基础模型。
豆包 MarsCode 是一款即将发布的智能开发工具,旨在通过AI技术激发开发者的创造力。它将为编程工作带来革命性的改变,提高开发效率,降低技术门槛。
Florence-2是由微软开发的高级视觉基础模型,采用基于提示的方法处理广泛的视觉和视觉-语言任务。该模型能够解释简单的文本提示,执行如描述、目标检测和分割等任务。它利用包含54亿个注释的5.4亿张图像的FLD-5B数据集,精通多任务学习。模型的序列到序列架构使其在零样本和微调设置中都表现出色,证明其为有竞争力的视觉基础模型。
Florence-2-large是由微软开发的先进视觉基础模型,采用基于提示的方法处理广泛的视觉和视觉-语言任务。该模型能够解释简单的文本提示来执行如图像描述、目标检测和分割等任务。它利用包含54亿注释的5.4亿图像的FLD-5B数据集,精通多任务学习。其序列到序列的架构使其在零样本和微调设置中均表现出色,证明是一个有竞争力的视觉基础模型。
Multi是一款专为软件开发团队设计的协作工具,它通过多人协作、共享控制、即时通讯和自动记录等功能,帮助团队成员更高效地沟通和工作。产品基于Zoom的高质量音视频基础设施,提供低延迟的共享控制体验,并通过AI技术自动生成会议摘要和行动项,进一步加速团队的软件开发流程。
通义灵码是一款专为开发者设计的智能编码助手,支持多种开发环境,包括JetBrains IDEs、Visual Studio Code、Visual Studio等。它通过集成先进的AI技术,帮助开发者快速完成编码任务,提高编码效率和质量,适用于各种编程语言和开发场景。