Diese Seite wurde von der Cloud Translation API übersetzt.

Cloud Vision API-Dokumentation

Produktdokumentation lesen

Mit der Cloud Vision API können Entwickler auf einfache Weise Features zur visuellen Erkennung in Anwendungen einbinden. Hierzu zählen die Erkennung von Bildlabels, Gesichtern und Sehenswürdigkeiten, die optische Zeichenerkennung (Optical Character Recognition, OCR) sowie die Kennzeichnung expliziter Inhalte mit Tags.

Jetzt kostenlos starten

Proof of Concept mit einem Guthaben in Höhe von 300 $starten

Zugriff auf Gemini 2.0 Flash Thinking erhalten
Kostenlose monatliche Nutzung beliebter Produkte wie KI-APIs und BigQuery
Keine automatischen Abbuchungen, keine Verpflichtungen

Angebote für kostenlose Produkte ansehen

Mehr als 20 Produkte immer kostenlos nutzen

Sie haben Zugriff auf mehr als 20 kostenlose Produkte für gängige Anwendungsfälle, darunter KI-APIs, VMs, Data Warehouses und mehr.

Dokumentationsressourcen

Finden Sie Kurzanleitungen und Leitfäden, prüfen Sie wichtige Referenzen und erhalten Sie Hilfe bei häufigen Problemen.

Cloud Vision API-Dokumentation

Proof of Concept mit einem Guthaben in Höhe von 300 $starten

Mehr als 20 Produkte immer kostenlos nutzen

Dokumentationsressourcen

Leitfäden

Referenz

Ressourcen

OCR-Anleitung

Eine einfache „Hello World“-Funktion in der Konsole erstellen

Big Data- & ML-Grundlagen

Erkennen Sie Text in Bildern durch Verknüpfen von Functions, Storage, die Vision API, Pub/Sub und die Translation API.

Automatische Klassifizierung von Daten, die mit der DLP API und Cloud Functions in Cloud Storage hochgeladen wurden

Mehrere Bilder in einer einzelnen Anfrage zusammenfassen und Ausgabe in Cloud Storage speichern

Speicher- und Verarbeitungsstandort für OCR-Anfragen festlegen

Anstößige Bildinhalte erkennen und unkenntlich machen

Text aus einem Foto mit Glossaren übersetzen und sprechen (Advanced)

Text in einem Bild (OCR) erkennen und einen Rahmen um den gefundenen Text zeichnen

Ähnliche Videos

Cloud Vision API selbst testen