Cloud Vision API-Dokumentation
Mit der Cloud Vision API können Entwickler auf einfache Weise Features zur visuellen Erkennung in Anwendungen einbinden. Hierzu zählen die Erkennung von Bildlabels, Gesichtern und Sehenswürdigkeiten, die optische Zeichenerkennung (Optical Character Recognition, OCR) sowie die Kennzeichnung expliziter Inhalte mit Tags.
Proof of Concept mit einem Guthaben in Höhe von 300 $starten
- Zugriff auf Gemini 2.0 Flash Thinking erhalten
- Kostenlose monatliche Nutzung beliebter Produkte wie KI-APIs und BigQuery
- Keine automatischen Abbuchungen, keine Verpflichtungen
Mehr als 20 Produkte immer kostenlos nutzen
Sie haben Zugriff auf mehr als 20 kostenlose Produkte für gängige Anwendungsfälle, darunter KI-APIs, VMs, Data Warehouses und mehr.
Dokumentationsressourcen
Leitfäden
Referenz
Ressourcen
Weitere Informationen
OCR-Anleitung
Hier erfahren Sie, wie Sie optische Zeichenerkennung (Optical Character Recognition, OCR) auf der Google Cloud Platform ausführen. In dieser Anleitung wird gezeigt, wie Sie Bilddateien in Google Cloud Storage hochladen, Text mit der Google Cloud Vision API aus den Bildern extrahieren, den Text mithilfe der Google Cloud Translation API übersetzen und Ihre Übersetzungen wieder in Cloud Storage speichern.
Eine einfache „Hello World“-Funktion in der Konsole erstellen
Stellen Sie Ihre erste Funktion ohne lokale Einrichtung schnell bereit.
Big Data- & ML-Grundlagen
In diesem eintägigen Präsenzkurs lernen die Teilnehmer die Big Data- und Machine-Learning-Funktionen von Google Cloud kennen. Sie erhalten einen kurzen Überblick über Google Cloud und einen tieferen Einblick in die Datenverarbeitungsfunktionen.
Erkennen Sie Text in Bildern durch Verknüpfen von Functions, Storage, die Vision API, Pub/Sub und die Translation API.
Reagieren Sie auf Cloud Storage-Änderungen mit einer Funktion, die ein Bild mit der Vision API verarbeitet, um Text zu extrahieren und dann an andere Dienste zu übergeben.
Automatische Klassifizierung von Daten, die mit der DLP API und Cloud Functions in Cloud Storage hochgeladen wurden
In Pub/Sub, Cloud Functions und der Data Loss Prevention API hochgeladene Daten können automatisch klassifiziert werden.
Mehrere Bilder in einer einzelnen Anfrage zusammenfassen und Ausgabe in Cloud Storage speichern
Führen Sie asynchrone Offline-Erkennungsdienste und -Annotationen großer Batches von Bilddateien über jeden Vision-Funktionstyp aus.
Speicher- und Verarbeitungsstandort für OCR-Anfragen festlegen
Legen Sie eine bestimmte Region fest, um Ressourcen für eine Anfrage zur optischen Zeichenerkennung (Optical Character Recognition, OCR) zu speichern und zu verarbeiten.
Anstößige Bildinhalte erkennen und unkenntlich machen
Veranschaulicht die Verwendung der Google Cloud Vision API und ImageMagick, um anstößige Bilder zu erkennen und unkenntlich zu machen, die in einen Cloud Storage-Bucket hochgeladen werden.
Text aus einem Foto mit Glossaren übersetzen und sprechen (Advanced)
Mit der Vision API, der Translation API und der Text-to-Speech API können Sie Text in einem Bild erkennen, Übersetzungen personalisieren und synthetische Sprache aus dem übersetzten Text generieren.
Text in einem Bild (OCR) erkennen und einen Rahmen um den gefundenen Text zeichnen
Mithilfe der Vision API können Sie Text in einem Bild erkennen und das Bild dann anhand des erkannten Texts annotieren.
Ähnliche Videos
Cloud Vision API selbst testen
Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.