GLM-4.1V-9B-Thinking 详解

对 RAPTOR 的优化工作，同样的逻辑从文档语义相似性扩展到文档相关性

SiReRAG

RAG & Agent Benchmark 调研

Qwen-vl 系列源码分析

通过 Qwen-VL 系列来了解下近两年多模态的发展趋势

论文速读合集 3-Qwen-VL 系列

论文速读合集 2 - MOCO, ALBEF, BLIP, BLIP2, LLaVA

 论文速读合集 1 - LiT, SigLIP

Qwen3-Embedding(2025)

MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training （202403）

CLIP(2021)

ViT(2020)

大致解释了 PPO 算法逻辑，记录我自己的学习过程中各种疑惑及理解

PPO详解

Qwen3 详解

MOBA: MIXTURE OF BLOCK ATTENTION FOR
LONG-CONTEXT LLMS

Native Sparse Attention(deepseek 稀疏 attention)

SFTTrainer 中对 train_dataset 和 data_collator 的预处理

 FlagEmbedding 的 Reranker 训练源码

RoPE 实现细节

PEFT-inject_adapter_in_model (LoRA)

HippoRAG 1 - 海马体 RAG

LightRAG

KG-RAG：Bridging the Gap Between Knowledge and Creativity

GraphRAG

gte-v1.5

BGE-M3-Embedding

Conan-embedding

移动窗口 mask 实现细节

源码分析

embedding

agent

多模态

往期整理

关于我

历史归档

文章分类

文章标签

友链

Github

Embedding

Connector Architecture

created_at

updated_at

author

website

email_contact

phone_contact

visibility

priority

attachments

is_featured

password

icon

date

type

slug

status

title

summary

Config

Post Gallery

Post Board

Table

类型为Notice的文章将被显示为公告

公告

 多模态、agent、AI for games 这些都不懂

hanyouyou & 她爹的升级之路

多模态-encoder

一、`inject_adapter_in_model` 入口

二、LoraModel

一、inject_adapter_in_model 入口

二、LoraModel

一、`inject_adapter_in_model` 入口