Embedding 是一種將文字、圖像或其他形式的資料轉換為向量表示的技術。OpenAI 提供的 Embedding API 透過大量文本的訓練, 可以將任意文字轉換為多維向量的形式,並且使相似的文字在向量空間中的距離更近。這些向量可以被用於搜索(Search)、聚類(Clustering)、 推薦(Recommendations)、異常檢測(Anomaly detection)、多樣性測量(Diversity measurement)、分類(Classification)。
財經M平方運用 OpenAI 的 Embedding API 計算每篇聯準會聲明稿的一致性程度,並將每篇聲明稿轉換為向量。一致性程度的算法為 1 - 向量距離, 其中距離以餘弦相似度(Cosine similarity)計算。橫軸與縱軸都是聲明稿的日期,顏色越紅(數值越高)代表兩篇聲明稿的一致性程度越高。
可以藉由一致性熱點圖判斷聯準會的態度是否改變,例如 2020 年 3 月至 2021 年底的聲明稿彼此一致性程度高, 此期間剛好為疫情發生後聯準會實施寬鬆政策時期。而 2022 年後聯準會開啟升息循環後的聲明稿與寬鬆時期相比就明顯降低。