Cloud Vision API 說明文件
Cloud Vision API 可讓開發人員輕鬆將視覺偵測功能整合到應用程式中,包括為圖片加上標籤、臉部和地標偵測、光學字元辨識 (OCR),以及為煽情露骨內容加上標記。
使用價值 $300 美元的免費抵免額開始概念驗證
- 取得 Gemini 2.0 Flash Thinking 存取權
- 每月免費使用熱門產品 (包括 AI API 和 BigQuery)
- 不會自動收費,也不會要求您一定要購買特定方案
繼續探索超過 20 項一律免費產品
使用超過 20 項實用的免費產品,滿足常見的使用需求,包括 AI API、VM 和資料倉儲等。
說明文件資源
相關資源
OCR 教學課程
瞭解如何在 Google Cloud Platform 上執行光學字元辨識 (OCR)。本教學課程將示範如何將圖片檔案上傳至 Google Cloud Storage、使用 Google Cloud Vision API 從圖片中擷取文字、使用 Google Cloud Translation API 翻譯文字,並將翻譯結果儲存回 Cloud Storage。
在控制台中建立簡單的「Hello, World!」函式
無須進行任何本機設定,即可快速部署第一個函式。
大數據與機器學習基礎知識
在這個由講師指導的一日課程中,參與者將瞭解 Google Cloud 的大數據和機器學習功能。這份文件會簡要介紹 Google Cloud,並深入探討資料處理功能。
連結 Functions、Storage、Vision API、Pub/Sub 和 Translation API,藉此偵測圖片中的文字
使用函式回應 Cloud Storage 變更,該函式會使用 Vision API 處理圖片,擷取文字並傳遞至其他服務。
使用 DLP API 和 Cloud Functions,為上傳至 Cloud Storage 的資料自動分類
使用 Pub/Sub、Cloud Functions 和 Data Loss Prevention API,自動分類上傳至 Cloud Storage 的資料。
在單一要求中為多張圖片加上註解,並將輸出內容儲存在 Cloud Storage 中
使用任何 Vision 功能類型,執行離線 (非同步) 偵測服務,並為大量圖片檔案加上註解。
設定 OCR 要求的儲存和處理位置
設定特定區域,用於儲存及處理光學字元辨識 (OCR) 要求所用的資源。
偵測並模糊處理令人反感的圖片內容
示範如何使用 Google Cloud Vision API 和 ImageMagick,偵測上傳至 Cloud Storage 值區的不雅圖片並進行模糊處理。
使用詞彙翻譯及朗讀相片中的文字 (進階)
使用 Vision API、Translation API 和 Text-to-Speech API,偵測圖片中的文字、提供個人化翻譯,並根據翻譯文字產生合成語音。
偵測圖片中的文字 (OCR),並在找到的文字周圍繪製邊框
使用 Vision API 辨識圖片中的文字,然後根據所偵測到的文字加上註解。
相關影片
親自試用 Cloud Vision API
新客戶還能獲得價值$300 美元的免費抵免額,可用於執行、測試及部署工作負載。