在 Azure Language Studio 使用 GPT 模型加速 Labeling 工作
兩周前 Azure Language Studio 公告了一個預覽的新功能: 利用 GPT 模型來加速 Labeling 的過程,我們就來試試看吧。
(P.S. 此功能目前是支援文字部分)
- 記得在 Azure OpenAI 中先佈署 text-davinci-002 模型,然後在 Access Control (IAM) 中設定好權限,這樣才能在 Azure Language Studio 中使用。
- 然後從 Language Studio 建立 Custom named entity recognition 專案。
將 label 檔案上傳到 Language Studio 的 Blob 中,記得準備至少 10 個 label 檔案,這樣才能使用 GPT 模型。這陣子剛好在看 Reid Hoffman 的 Impromptu,就拿他的一段來當 label 檔案。
- 終於可以開始使用 GPT 模型了,點選
Data labeling
,然後右側的Auto-label
。
- 這時候可以直接選取對應的 Azure OpenAI,以及 GPT 模型,照推薦的 text-davinci-002 來選擇,然後選擇要使用的 label 檔案,新增 Entity (或是選取現有的 Entity),最後點選 Start labeling job。
- 等待一段時間,就可以看到 Labeling Job 完成了。
- 上傳的檔案會自動被 GPT 模型標記,然後還是需要人工檢查,確認標記的正確性。
是不是很方便呢!