DSP mit Optimierung für KI Sprach- und Audioverarbeitung

2nd November 2018
Posted By : Victoria Chercasova
DSP mit Optimierung für KI Sprach- und Audioverarbeitung

SAN JOSE, Kalifornien - Cadence Design Systems, Inc. hat heute den Cadence Tensilica HiFi 5 DSP IP-Core für Audio und Sprache vorgestellt.

Dies ist der erste IP-Core, der für eine leistungsfähige Fernfeld-Verarbeitung und KI-basierte (künstliche Intelligenz) Spracherkennungoptimiert ist. Die fünfte Generation des HiFi DSP bietet die doppelte Leistung bei der Audioverarbeitung und eine um Faktor vier höhere NN-Verarbeitung (neuronales Netz) gegenüber dem HiFi 4 DSP. Dadurch ist dieser ideal für sprachgesteuerte Bedienoberflächen in digitalen Heim-Assistenten und für Automobil-Infotainment.

Durch die zunehmende Beliebtheit von digitalen Heim-Assistenten werden sprachgesteuerte Bedienoberflächen für die Hersteller von innovativen Konsumgütern immer wichtiger. Fortschrittliche DSP-Algorithmen entwickeln sich rasch weiter und können Störungen inzwischen gut reduzieren sowie die Stimme des Sprechers besser isolieren und verstehen. Allerdings erfordert dies eine höhere Verarbeitungsleistung und eine bessere Energieeffizienz. Zusätzlich führen NN-basierte Spracherkennungsalgorithmen mehr Aufgaben lokal durch, anstatt in der Cloud, auf Grund von Bedenken hinsichtlich Latenz, Datenschutz und Netzwerkverfügbarkeit.

„Um die äußerst schwierigen Herausforderungen bei Portierung von rechenintensiven NN-basierten Fernfeld-Verarbeitungs- und Spracherkennungsalgorithmen auf energiesparende Geräte lösen zu können, hat sich Ambiq Micro als erster Halbleiterlizenznehmer für den HiFi 5 DSP von Cadence entschieden", sagt Aaron Grassian, Vice President of Marketing von Ambiq Micro. „Durch die Portierung des HiFi 5 DSP auf die Subthreshold Power Optimized Technology (SPOT) Plattform von Ambiq Micro können Produktentwickler, ODMs und OEMs die vielfältigen Möglichkeiten der Technologien von führenden Audio-Software-Anbietern, wie DSP Concepts und Sensory, nutzen. Sie können so Sprachassistenten sowie dialogorientierte Benutzerschnittstellen (UI) zur Steuerung in portablen und mobilen Produkten integrieren, ohne dass dies die Qualität oder Batterielaufzeit beeinträchtigt."

Wichtige Merkmale des HiFi 5 DSP:

  • Ÿ  Fünf-Slot-VLIW-Architektur (Very Long Instruction Word) für zwei 128-Bit-Ladeoperationen pro Zyklus;
  • Ÿ  2 x MAC Funktionalität gegenüber HiFi 4 DSP für Pre- und Postverarbeitung, umfasst:

                  Unterstützung für acht 32x32 Bit oder 16 16x16 Bit MACs pro Zyklus;

Ÿ                  Optional acht Gleitkomma-MACs mit einfacher Genauigkeit pro Zyklus.

  •  4x MAC Funktionalität gegenüber HiFi 4 DSP für die NN-Verarbeitung, umfasst:

Ÿ                 32 16x8 oder 16x4 MACs pro Zyklus;

Ÿ                Optionale 16 Gleitkomma-MACs mit halber Genauigkeit pro Zyklus.

  • Ÿ  Die neue HiFi NN Bibliothek bietet einen hoch optimierten Satz von Bibliothek-Funktionen, die häufig in der NN-Verarbeitung genutzt werden (besonders Sprache). Diese Bibliothek-Funktionen können einfach in populäre maschinelle Lern-Frameworks integriert werden;
  • Ÿ  Softwarekompatibilität mit der gesamten HiFi Produktlinie, die mehr als 300 HiFi-optimierte Audio- und Sprach-Codecs sowie Softwarepakete zur Audio-Verbesserung umfasst.

„Die starke Zunahme der Beliebtheit von digitalen Heim-Assistenten mit überzeugenden Sprach-UI-Erfahrungen hat eine neue Welle der Innovation bei Fernfeld-Verarbeitungsalgorithmen und in der Spracherkennung mit neuronalen Netzen ausgelöst", sagt Larry Przywara, Group Director of Marketing, Tensilica Audio/Voice IP bei Cadence. „Der HiFi 5 DSP adressiert beide dieser Hochleistungsverarbeitungsaspekte mit verbesserten Gleit- und Festkomma-DSP-Fähigkeiten und einer integrierten Unterstützung für neue Datentypen, die Speicher und Energie sparen. Der HiFi 5 DSP gewährleistet eine Code-Kompatibilität mit der vorhandenen HiFi DSP Produktlinie, so dass ein großes Audiosoftware-Ökosystem bereits verfügbar ist."

Meinungen von Partnern/Analysten

„Die KI-Verarbeitung ist inzwischen im Bereich der digitalen Heimanwendungen angekommen", sagt Mike Demler, Senior Analyst bei der The Linley Group. „Da die Verbraucher eine geringere Latenz, einen besseren Datenschutz und natürlichere Sprach-UI-Interaktionen fordern, benötigen die Geräte eine immer höhere Rechenleistung. Der HiFi 5 DSP kann die erforderliche Performance für die Vorverarbeitung einschließlich einer Echounterdrückung und Rauschunterdrückung zur Verfügung stellen. Durch seine NN-Performance von 32-MAC/Zyklus und die direkte Unterstützung kleinerer Gewichte ist dies eine effiziente Lösung für die Ausführung komplexer Spracherkennungsalgorithmen."

„Eine interessante Herausforderung für OEMs ist die Nachfrage nach neuen DSP-intensiven Audiofunktionen, während gleichzeitig immer kürzere Entwicklungszeitpläne unterstützt werden sollen", meint Paul Beckmann, Chief Technology Officer von DSP Concepts. „Um diese gegensätzlichen Anforderungen erfüllen zu können, müssen die Produktentwickler leistungsfähige Verarbeitungs-Cores, wie den HiFi 5 DSP mit seiner doppelt so hohen Gleitkomma-Leistung einsetzen, um dann ihre Audiofunktionen mit grafischen Konfigurationstools wie Audio Weaver Designer zu erstellen. Ohne beide Fähigkeiten - moderne Halbleiter und Entwicklungstools - kann man nur schwer Schritt halten."





Sign up to view our publications

Sign up

Sign up to view our downloads

Sign up

SPS IPC Drives 2018
27th November 2018
Germany Nuremberg
International Security Expo 2018
28th November 2018
United Kingdom London Olympia
The Security Event 2019
9th April 2019
United Kingdom NEC, Birmingham
Ceramics Expo 2019
29th April 2019
United States of America International Exposition Center (I-X Center)