Im Rahmen einer Open-Source Lizenz haben Intel Forscher eine neue Software veröffentlicht, die Computern das Lippen lesen von Menschen ermöglicht. Somit sollen sich künftig so genannte Spracherkennungsprogramme noch weiter verbessern lassen. Weitere Informationen zu diesem Projekt von Entwickler Intel, erhalten sie in der folgenden Presseinfo...
"Intel Developer Forum, Berlin, 28. April 2003 - Forscher der Intel Corporation haben im Rahmen einer Open-Source Lizenz eine neue Software veröffentlicht. Sie ermöglicht Entwicklern den Bau von Computern, die wie Menschen sehen und "Lippen lesen" können. Auf diese Weise können PCs gesprochene Befehle besser verstehen.
Aktuelle leistungsfähige Spracherkennungs-Algorithmen arbeiten zufriedenstellend, wenn kein Hintergrundlärm auftritt oder ein sehr gut eingestelltes Headset verwendet wird. Ihre Genauigkeit lässt jedoch sehr schnell nach, wenn die Applikationen mit durchaus üblichen geräuschintensiven Umgebungen zurechtkommen müssen, wie dies etwa auf öffentlichen Plätzen der Fall ist. In Kombination mit Gesichtserkennungsalgorithmen aus Intels OpenCV Computer Vision Bibliothek ermöglicht der Einsatz von Audio Visual Speech Recognition (AVSR) Software, dass die Computer das Gesicht eines Sprechers erkennen und ihren Mundbewegungen folgen. Die Synchronisation von Videodaten mit Sprachidentifizierung macht deutlich genauere Spracherkennung möglich und verbessert damit eine große Vielzahl von Sprachanwendungen in geräuschintensiven Umgebungen. Die AVSR Software ist Teil der Intel OpenCV Computer Vision Bibiliothek. Diese Toolbox besteht aus mehr als 500 Bildverarbeitungsfunktionen, mit deren Hilfe Forscher bilderkennende Applikationen entwickeln können.
"Intel möchte Technologien entwickeln, mit deren Hilfe Computer auf natürliche Art und Weise wie Menschen mit der Welt interagieren können. Die Erkennung durch den Menschen basiert nur selten auf einer einzigen Informationsart. Wir treffen Entscheidungen durch die Kombination von Informationen aus einer Vielzahl von Quellen", sagte Justin Rattner, Intel Senior Fellow der Enterprise Platform Group und Director des Intel Microprocessor Research Labs. "Die Ergänzung von Intels OpenCV Bibliothek durch Audio/Video Spracherkennungscode wird die Forschung und Entwicklung in bildgestützter Spracherkennung ganz sicher vorantreiben."
Beschleunigte Forschung für neue Einsatzbereiche
Schnellere Mikroprozessoren, sinkende Kamerapreise und eine um den Faktor 10 höhere Bandbreite bei der Videoaufzeichnung durch Technologien wie USB2.0 versetzen auch konventionelle PCs in die Lage, bilderkennende Algorithmen in Echtzeit ausführen zu können. OpenCV wurde für eine Innovationsbeschleunigung in diesem Bereich entwickelt, indem sie Quellcode für einen weiten Bereich aus bilderkennenden und bildverarbeitenden Funktionen bereitstellt. Seit ihrer Veröffentlichung im Jahr 2000 verzeichnete OpenCV mehr als 500.000 Code-Downloads, außerdem haben sich mehr als 5.000 Mitglieder für die User Group registriert.
Entwickler verwenden OpenCV Code in Applikationen, die von Spielzeugen bis hin zur industriellen Fertigung reichen. Die Software beinhaltet C Source-Code für alle Funktionalitäten der Bibliothek sowie eine Redistributions-Lizenz ohne anfallende Lizenzgebühren. Informationen über AVSR finden Sie unter www.intel.com/research/mrl/research/avcsr.htm.
Die OpenCV Website ist unter www.intel.com/research/mrl/research/opencv/ zu finden. Einzelpersonen, die der User Group beitreten möchten, können sich unter groups.yahoo.com registrieren und die Gruppe durch eine e-Mail an OpenCV unter subscribe@yahoogroups.com abonnieren..."
Im zurückliegenden Monat gab es wieder einige spannende Themen im Bereich Newsmeldungen sowie interessante Artikel und Produkttests. Folgend möchten wir...
Zugriffsrechte sind ein zentraler Bestandteil jedes Macs. Durch sie wird geregelt, wer auf bestimmte Dateien, Ordner und Programme zugreifen kann....
Online-Casinos bieten deutlich mehr Bequemlichkeit und Flexibilität als ihre stationären Pendants. Man kann bequem von zu Hause oder unterwegs spielen,...
AGON by AOC präsentiert mit dem 67,3 cm (26,5") AGON PRO AG276UZD ein QD-OLED-Modell, das auf dem Erfolg des beliebten...
Ein leistungsfähiges Heimnetzwerk sorgt für stabile digitale Abläufe und reduziert Verbindungsabbrüche spürbar. Probleme beim Streaming, langsame Dateiübertragungen oder Latenzspitzen beim...
Mit der T-FORCE Z540 bietet Hersteller TEAMGROUP eine schnelle PCIe Gen5 SSD mit bis zu 4 TB Speicherkapazität an. Wir haben uns das 2-TB-Modell im Test angesehen und z.B. mit anderen Gen5-Drives verglichen.
Die Familie der Iron Wolf Pro NAS-Festplatten ist für Dauerbetrieb, Zuverlässigkeit und den Einsatz in Multi-Bay-Systemen ausgelegt. Wir haben das 24-TB-Modell durch unseren Parcours geschickt.
Unter der Marke SanDisk Professional bietet Western Digital eine All-Terrain-Festplatte namens G-DRIVE ArmorATD an. Wir haben die mobile HDD mit IP54-Klassifizierung und satten 6 TB im Test auf Herz und Nieren geprüft.
Mit dem WD_BLACK P10 Game Drive hat Western Digital eine Speichererweiterung für PCs und Konsolen im Programm. Wir haben uns die mobile Festplatte mit satten 6 TB im Praxistest genauer angesehen.