Embedding: 将意义转化为机器可以计算的“坐标”
想象一下,你想让一台只懂数学的计算机,去理解世界上纷繁复杂的概念——比如“苹果”、“香蕉”和“牛排”。对它来说,这些词语只是一串毫无意义的符号。
为了解决这个问题,我们聘请了一位 “全能营养师”。这位营养师的超能力是,能将任何食物,都转换成一张标准化的 “营养成分表”,上面用精确的数字,记录了数百种成分的含量。
- 苹果的“营养成分表”:
[糖分: 10.4, 维生素C: 4.6, 纤维: 2.4, ...]
- 牛排的“营养成分表”:
[蛋白质: 25.0, 铁: 2.6, 脂肪: 15.0, ...]
这张由数字组成的“营养成分表”,就是 Embedding。这个转化的过程,就叫做“向量化”。它的核心目的,是将人类世界中模糊的、基于上下文的“语义”,转化为机器可以理解和计算的“数学关系”。