安爸-超级家庭
bg

AI进家庭

小红书上周发布的大模型 dots.llm1 已经被 llama.cpp 支持

小红书上周发布的大模型 dots.llm1 已经被 llama.cpp 支持了, 有本地想生成小红书体的朋友可以直接使用 llama.cpp 作为推理引擎了。 参考文献: [1] https://www.reddit.com/r/LocalLLaMA/comments/1lbva5o/rednotehilab\_dotsllm1\_support\_has...

阅读:7 评论:0

Keller Jordan的一篇博文,介绍了自己写的一种名为Muon的优化器

Keller Jordan的一篇博文,介绍了自己写的一种名为Muon的优化器,它专门用于优化神经网络中的隐藏层参数。Muon在NanoGPT和CIFAR-10的速度记录中得到了应用,并显著提高了训练速度。文章详细讨论了Muon的设计原理、实现方法、实验结果以及与其他优化器的比较。 参考文献: [1] https://kellerjordan.github...

阅读:9 评论:0

使用 LoRA 和QLoRA 微调大模型的教程

这个教程很适合新手看,一步步按照教程来就行。如果有不懂的地方,直接把链接扔给AI,打开联网功能,直接提问即可。 参考文献: [1] http://www.mercity.ai/blog-post/guide-to-fine-tuning-llms-with-lora-and-qlora 知识星球服务内容:Dify源码剖析及答疑,Dify对话系统源码...

阅读:8 评论:0

本世纪最伟大AI专访之一:AI安全、Agent、OpenAI等重磅话题

专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注! 昨晚,油管千万级大V The Diary Of A CEO放出了,与图灵奖、诺贝尔奖获得者,被誉为AI教父的Geoffrey Hinton最新深度专访。, 二人以对话形式主要探讨了AI...

阅读:7 评论:0

松下发布多模态大模型,文本、图像、音频随意切换

专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注! 随着大模型的不断发展,多模态数据处理成为了新的热点领域。多模态生成任务主要通过整合多种类型的数据,如文本、图像、音频等,实现不同模态之间的相互转换与生成。 例如,将一段文字描述转换为生...

阅读:7 评论:0

AI搜索平台Glean获1.5亿美元,估值72亿美元

专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注! CNBC消息,Glean宣布完成1.5亿美元F轮融资,这使得其估值在不到一年内从46亿美元飙升至72亿美元。 本次由Wellington Management领投,现有投资者Capit...

阅读:9 评论:0

乐鑫携手扣子”完全开源”第三代AI智能硬件,支持MCP,交互能力MAX!

这可真是第三代AI智能硬件了。 第一代、第二代都有给大家推荐过,第三代肯定不能缺席,毕竟这么好落地的AI硬件不多见。 第一代是小智做的那种,轻智能对话;第二代是完全开源了服务端,能自定义一些功能了。 今天给大家讲的是第三代,EchoEar 喵伴。 会听、会动、会陪伴,支持MCP,还能像小爱同学那样控制智能家居。 扫码加入AI交流群 获得更多技术支持和交流 ...

阅读:7 评论:0

大力出奇迹失灵了?ModelSwitch跳出采样黑洞,改写大模型推理范式

在大型语言模型(LLM)飞速发展的今天,如何进一步提升其性能,成为了研究者们关注的焦点。现在许多工作基于“重复采样-投票”框架在测试时进行大量采样以提高回答的准确性,有时一个问题甚至需采样成百上千次,这带来巨大的计算开销。我们不禁要问:我们真的需要那么多次采样吗? 本文介绍的 ModelSwitch 策略,正是在性能和效率间寻找一平衡点。它放弃一味增加单一...

阅读:7 评论:0

ACL 2025 数据多不如风格齐?SCAR精选

总览 这是 RMIT 大学、新南威尔士大学和莫纳什大学联合发表的论文。这篇论文提出了一种新的数据选择方法 SCAR(Style Consistency-Aware Response Ranking),旨在通过选择具有风格一致性的高质量训练数据来提高大语言模型指令微调的效率。 当前大语言模型的指令微调通常需要大量的训练数据,但这些数据往往存在风格不一致的问...

阅读:7 评论:0

从“比像素”到“懂语义”!Video-Bench实现视频质量精准打分,突破73%人类认同率

现如今,视频生成技术正以前所未有的速度革新着我们的视觉内容创作方式。从电影制作到广告设计,从虚拟现实到社交媒体,高质量且符合人类期望的视频生成模型正变得越来越重要。如何准确评估这些模型的性能,确保它们生成的视频准确符合人类的审美和需求,成为了一个亟待解决的问题。 来自上海交通大学、斯坦福大学、卡内基梅隆大学等机构的研究团队提出了创新的视频评估框架 Vid...

阅读:8 评论:0