Large Language Model 归档

我们经常听到关于 AI Agent 的说法，它们可以使用工具预约会议、搜索互联网，甚至生成代码。然后出现了另一个术语 “Agentic AI”。听起来很像，但实际上，它们并不一样。虽然两者都涉及人工智能为我们做事，但它们背后的思维方式和设计却截然不同。一个遵循指令，另一个则根据目标自行做出决策。 AI Agent 和 Agentic AI 之间的区别是一个必须知道的概念。在本文中，我们将分析它们的真正区别，以及为什么这种差异在人工智能中具有重要意义。什么是 AI Agent？ AI…

2025年7月13日 0条评论 780点热度 0人点赞阅读全文

Anthropic于 2024 年 11 月发布了模型上下文协议 (MCP) 。它由 Anthropic 的 Mahesh Murag 开发。在这里可以查看完整的官方文档。目前，MCP 已完全实现为Python SDK和TypeScript SDK。上下文是关键生成式 AI 模型的基本能力取决于其预训练细节、训练数据和模型架构。为了使这些预训练模型表现更佳，并提高其与任务的相关性和一致性，您必须为其提供良好的环境。这里的上下文是指模型用来生成相关且连贯的响应的信息。上下文决定了模型如何理解和继续对话、完成文本…

2025年6月22日 0条评论 799点热度 0人点赞阅读全文

本文提供从头开始构建 Llama 3 模型的完整架构并对自定义数据集执行训练和推理的分步指南。读完这篇文章后您将获得什么成果？先决条件现在我们知道了我们想要实现的目标，让我们开始一步一步构建一切。步骤 1：输入块如上图的 Llama 3 架构图所示，输入块有 3 个组件：文本/提示、标记器和嵌入。输入块内的组件如何工作？有一句流行的说法“一图胜千言”，让我们查看下面的流程图来了解输入块内的工作流程。让我们对输入块进行编码：步骤 2：解码器块如果您查看上面的架构图，解码器块由以下子组件组成。让我们…

2024年9月15日 0条评论 4634点热度 0人点赞阅读全文

作者：王一凡，英特尔边缘计算创新大使 1.1 Phi-3-mini模型简介 2024年4月23日，微软研究院公布Phi-3系列AI大模型，包含三个版本：mini(3.8B参数)、**all(7B参数)以及medium(14B参数)。phi-3-mini是一个拥有3.8B参数规模的模型，其训练数据集基于Phi-2所使用数据集的扩大版本，由大量过滤后的网络数据和合成数据组成，经过3.3T tokens的训练，表现可以与Mixtral 8x7B和GPT-3.5等模型相媲美（例如，phi-3-mini在MMLU测…

2024年8月9日 0条评论 4469点热度 0人点赞阅读全文

1. 简介 Hugging Face是一个大型开源社区，它迅速成为自然语言处理 (NLP)、自动语音识别 (ASR) 和计算机视觉 (CV) 领域的预训练深度学习模型的诱人中心。 Optimum Intel提供了一个简单的界面来优化 Transformer 模型并将其转换为OpenVINO™中间表示 (IR) 格式，以使用 OpenVINO™ 运行时加速英特尔® 架构上的端到端管道。情感分类（sentimental classification）是流行的 NLP 任务之一，是识别文本中的观点并将其标记为正面或负面…

2024年8月8日 0条评论 4695点热度 0人点赞阅读全文

寻找股票进行投资可能是一个漫长而乏味的过程。如果我们同时使用 AI 和 Python 来创建一个可以加快这一过程的程序会怎么样？在这篇博文中，我将探讨如何使用finvizfinance Python 库来查找“被低估”的股票。然后，我将介绍一种使用 FinBERT（一种预先训练的 NLP 模型）进行情绪分析的方法——可以对这些“被低估”的股票进行分析。准备工作首先，我们需要安装所需的库并导入它们。finviz.com是一个提供各种股票分析工具的网站，例如免费的股票筛选器 – 在这里，导入 finviz…

2024年6月12日 0条评论 5774点热度 0人点赞阅读全文

大型语言模型 (LLM) 彻底改变了我们从大量文本数据中提取信息和观点的方式。在财务分析领域，LLM 应用程序旨在帮助分析师回答有关公司业绩、收益报告和市场趋势的复杂问题。其中一个应用涉及使用检索增强生成 (RAG) 管道来促进从财务报表和其他来源提取信息。设想这样一个场景：一位财务分析师想要了解某公司第二季度财报电话会议的关键要点，特别是该公司正在构建的技术护城河。这类问题超出了简单的查找范围，需要更复杂的方法。这就是 LLM 代理的概念发挥作用的地方。什么是代理？根据 Llama-Index 的说法，“代…

2024年6月2日 0条评论 3179点热度 0人点赞阅读全文

在快速发展的金融市场中，准确的股价预测就像是圣杯。随着我们寻求更复杂的技术来解释市场趋势，机器学习成为了希望的灯塔。在各种机器学习模型中，长短期记忆 (LSTM) 网络引起了广泛关注。当与注意力机制相结合时，这些模型会变得更加强大，尤其是在分析股票价格等时间序列数据时。本文深入探讨了 LSTM 网络与 Attention 机制相结合，利用雅虎财经 ( yfinance ) 的数据预测苹果公司 ( AAPL ) 股价接下来的走势。了解金融建模中的 LSTM 和 Attention 机制 LSTM 网络基础知识 LS…

2024年5月29日 0条评论 3998点热度 1人点赞阅读全文

有没有想过在树莓派（Raspberry Pi）设备上运行自己的大型语言模型 (LLM) 或视觉语言模型 (VLM)？你可能想过，但一想到要从头开始设置，必须管理环境，下载正确的模型权重，以及对设备是否能处理该模型的挥之不去的疑虑，你可能会犹豫不决。目前，边缘的 LLM 似乎还遥不可及。但随着时间的推移，这种特定的用例应该会逐渐成熟，我们肯定会看到一些很酷的边缘解决方案被部署，并在边缘设备上运行全本地生成 AI 解决方案。树莓派（Raspberry Pi）介绍 Raspberry Pi 是一系列低成本、单板计算机…

2024年5月17日 0条评论 4065点热度 0人点赞阅读全文

您是否已经掌握了通过多次迭代、改进和批评第一个版本来从 ChatGPT 中获取高质量文本的方法？如果您需要反复解决类似的任务，而又没有时间阅读大量版本并对其进行批评，该怎么办？如果您想与尚未学会有效“指导”人工智能的同事分享您的提示，该怎么办？让我们探索一下在上述情况下如何为大型语言模型 (LLM) 创建指令：我们进行了实验来比较零样本提示词的几个版本，以以下问题为例：会议记录分析和基于标准的评估。 1. 学习提示让我们来看看一个旨在分析会议记录的提示，根据特定标准提供评估，以及改进建议。此类任务可以极大地帮…

2024年5月10日 0条评论 1914点热度 0人点赞阅读全文

12 3 4