•  置顶

    Hello World 👋

    欢迎来到我的博客!
  • 【Smol Course】8-智能体

    AgentAI 智能体(AI Agents)是一种自主系统,能够理解用户请求、将请求拆解为多个步骤,然后执行相应行动以完成任务。它们将语言模型与工具及外部功能相结合,从而与所处环境进行交互。本模章将讲解如何使用 smolagents 库构建高效的智能...
  • 【Smol Course】7-推理

    Inference推理是使用经过训练的语言模型来生成预测或响应的过程。虽然推理可能看起来很简单,但大规模有效地部署模型需要仔细考虑各种因素,如性能、成本和可靠性。大型语言模型(llm)由于其大小和计算需求而提出了独特的挑战。 LLM 推理可以分为两种...
  • swanlab 使用

    解决 wandb 无法访问的问题首先在环境中安装 swanlab,然后登录 12pip install swanlabswanlab login 然后在要运行的 Python 文件前加上以下代码,注意要在 wandb.init() 之前。 12im...
  • 【Smol Course】6-合成数据

    合成数据是模拟真实世界使用情况的人工生成的数据。它允许通过扩展或增强数据集来克服数据限制。尽管合成数据已经用于一些用例,但大型语言模型使得合成数据集在训练前和训练后以及语言模型的评估中更受欢迎。
  • 【Smol Course】5-视觉语言模型

    VLM Usage视觉语言模型(vlm)弥合了图像和文本之间的差距,实现了高级任务,如生成图像字幕,基于视觉回答问题,或理解文本和视觉数据之间的关系。它们的架构旨在无缝地处理这两种模式。 Chat Format许多 vlm 的结构以类似聊天机器人的方...
  • 【Smol Course】4-评估

    Evaluation全面的评估策略检查模型性能的多个方面。我们评估特定于任务的功能,如问题回答和总结,以了解模型如何处理不同类型的问题。我们通过连贯性和事实准确性等因素来衡量输出质量。安全评估有助于识别潜在的有害输出或偏见。最后,领域专业知识测试验证...
  • 【Smol Course】3-参数高效微调

    Parameter-Efficient Fine-Tuning (PEFT)随着语言模型变得越来越大,传统的微调变得越来越具有挑战性。即使是 1.7B 参数模型的全面微调也需要大量的 GPU 内存,使存储单独的模型副本变得昂贵,并且有可能灾难性地忘记...
  • 【Smol Course】2-偏好对齐

    Preference Alignment监督微调有助于模型学习任务,但偏好对齐鼓励输出符合人类的期望和价值观。 Direct Preference Optimization (DPO):直接偏好优化(DPO)通过使用偏好数据直接优化模型来简化偏好对...
  • 【代码随想录】动态规划1-基础

    动态规划动态规划中每一个状态一定是由上一个状态推导出来的,这一点就区分于贪心,贪心没有状态推导,而是从局部直接选最优的。 解题步骤: 确定 dp 数组(dp table)以及下标的含义 确定递推公式 dp 数组如何初始化 确定遍历顺序 举例推导 d...
/7