LLaMA-Factory 简介 LLaMA-Factory 是一个开源项目,它提供了一套全面的工具和脚本,用于微调、服务和基准测试 LLaMA 模型。LLaMA(大型语言模型自适应)是 Meta AI 开发的一组基础语言模型,在各种自然语言任务上表现出色。 LLaMA-Factory 存储库提供以下内容,让您轻松开始使用 LLaMA 模型: 在本文中,我们将介绍使用 LLaMA-Factory 微调和部署 LLaMA 模型的关键步骤。 如何设置 LLaMA-Factory LlaMA-Factory 是一个开源的…

2024年5月4日 0条评论 2760点热度 2人点赞 阅读全文

OpenAI 的 GPT-3、Google 的 BERT 和 Meta 的 LLaMA 等大型语言模型 (LLM) 的功能正在改变各个行业,因为它们能够生成各种类型的文本,从营销内容和数据科学代码到诗歌。尽管 ChatGPT 因其用户友好的聊天界面而备受关注,但通过将 LLM 集成到不同的软件应用程序中,仍存在许多尚未开发的可能性。在本文中您可以了解有关使用 LangChain 构建 AI 应用程序的更多信息,您将在其中了解如何使用 Whisper 语音到文本 AI 转录 YouTube 视频内容,然后使用 GPT…

2024年5月3日 0条评论 516点热度 0人点赞 阅读全文

大型语言模型 (LLM) 正在给各个行业带来革命性的变化。从客户服务聊天机器人到复杂的数据分析工具,这项强大技术的功能正在重塑数字交互和自动化的格局。 然而,LLM 的实际应用可能会受到对高性能计算的需求或对快速响应时间的需求的限制。这些模型通常需要复杂的硬件和广泛的依赖性,这使得它们很难在更受限的环境中采用。 这就是 LLaMa.cpp 发挥作用的地方,它为重量级框架提供了更轻、更便携的替代方案。 什么是 Llama.cpp? LLaMa.cpp 由 Georgi Gerganov 开发。它以高效的 C/C++ …

2024年4月30日 0条评论 2735点热度 1人点赞 阅读全文

正如谷歌、三星和微软继续在 PC 和移动设备上推动生成式 AI 的努力一样,苹果也正在通过OpenELM加入这一行列,这是一个新的开源大语言模型 (LLM) 系列,可以完全在移动设备上本地运行,而不必连接到云服务器。 OpenELM简介 OpenELM于4月24日在 AI 代码社区 Hugging Face 上发布,它由旨在高效执行文本生成任务的小型模型组成。 总共有八个 OpenELM 模型,其中四个是预训练的,四个是指令调整的,涵盖了 2.7 亿到 30 亿个参数之间的不同参数大小(指的是L…

2024年4月25日 0条评论 568点热度 0人点赞 阅读全文

Meta Llama 3 简介 Meta于4月18日正式发布了其 Llama 系列开放式生成式 AI 模型的最新成员:Llama 3。新模型 Llama 3 8B(包含 80 亿个参数)和 Llama 3 70B(包含 700 亿个参数)与上一代 Llama 模型 Llama 2 8B 和 Llama 2 70B 相比,在性能方面实现了“重大飞跃”。 (参数本质上定义了 AI 模型处理问题(例如分析和生成文本)的技能;一般来说,参数数量较高的模型比参数数量较低的模型更强大。)事实上,Meta 表示,就各自的参数数量…

2024年4月20日 0条评论 726点热度 0人点赞 阅读全文

在快速发展的人工智能领域,大型语言模型已成为该领域最新突破的主角。大型语言模型(LLM)迅速普及,几乎每周都会出现新的模型,这引发了用于容纳这项技术的托管选项的同步增长。文本生成已成为一项突破性的功能,改变了机器理解和生成类似人类的文本的方式。正是由于这种流行,才推出了多种工具来简化和促进 LLM 的工作流程。在可用于此目的的众多工具中,Hugging Face 的文本生成推理 (Text Generation Inference,TGI) 尤其值得一提,因为它允许我们在本地机器上将 LLM 作为服务运行。 简单地…

2024年4月9日 0条评论 1626点热度 0人点赞 阅读全文

想象一下你第一次听到机器发出的声音,听起来就像是人类的声音。你既惊讶又难以置信,对这项技术能走多远充满好奇。GPT-SoVITS 不仅突破了界限,还重新定义了界限。这不仅仅是机器说话;而是它们用一种带有人类语言的细微差别、情感和独特性的声音说话,标志着语音技术的未来已经到来。 GPT-SoVITS 的主要特点 GPT-SoVITS 不仅仅是一个工具;它是语音技术的一项突破,带来了多项创新功能。让我们详细探讨一下这些功能: 零样本 TTS:未来展望 小样本 TTS:用最少的数据创造真实感 跨语言支持:打破语言障碍 集…

2024年3月31日 0条评论 3037点热度 0人点赞 阅读全文

第八届瑞芯微开发者大会RKDC! 2024于3月7-8日在福州喜来登酒店隆重举行。瑞芯微作为国内领先的嵌入式处理器设计企业,为高端智能硬件的多个领域提供专业芯片解决方案。本届大会以“AI芯片·AI应用·AIoT”为主题,集结最新前沿技术、大咖智见分享,展示了百款AIoT芯品,围绕万物智联,打造多场景AI应用。格蠹科技自主研发的幽兰 Arm PC(Windows on Arm)也在此次大会上惊艳亮相。 提到 Arm PC,这里我们先简要回顾一下Arm PC的发展历史。自20世纪80年代以来,Wintel联盟就一直主导…

2024年3月9日 0条评论 453点热度 0人点赞 阅读全文

ServiceNow、Hugging Face 和 NVIDIA 于2月28日宣布发布 StarCoder2,这是一个用于代码生成的开放式大型语言模型系列,为性能、透明度和成本效益设定了新标准。StarCoder2 是与 BigCode 社区合作开发的,由ServiceNow和 Hugging Face管理。 StarCoder2简介 StarCoder2 经过 619 种编程语言的培训,可以进一步培训并嵌入到企业应用程序中,以执行专门的任务,例如应用程序源代码生成、工作流生成、文本摘要等。开发人员可以使…

2024年3月2日 0条评论 1185点热度 0人点赞 阅读全文

相信很多小伙伴都已经知道,在最新一代的英特尔® 酷睿™ Ultra 移动端处理中已经集成了被称为 NPU 的神经网络加速处理器,以提供低功耗的 AI 算力,特别适合于 PC 端需要长时间稳定运行的 AI 辅助功能,例如会议聊天软件中的自动抠像,或是画面超分辨率等应用。而 OpenVINO™ 工具套件也在第一时间对 NPU 进行了适配,接下来就让我们一起看一下如何在英特尔® 酷睿™ Ultra 处理器上搭建基础环境,并调用 NPU 进行模型推理任务。 NPU驱动安装 首先我们需要确保是否安装了最新…

2024年2月24日 4条评论 1480点热度 1人点赞 阅读全文