• LinkedIn
  • KONTAKT
  • ANNONCERING
  • PARTNERLOGIN

ElektronikFOKUS

Fokus på elektronik

  • Branchenyt
  • Design & udvikling
  • Events
  • IoT & embedded
  • Komponenter & konnektorer
  • Power
  • Produktion
  • Test & mål
  • Wireless & data
  • Artikler fra Aktuel Elektronik

Design & udviklingWireless & data13. 12. 2024 | Rolf Sylvester-Hvid

Talegenkendelse på telefonen kan snart klares uden internet

Design & udviklingWireless & data13. 12. 2024 By Rolf Sylvester-Hvid

I dag har mere end hver fjerde gjort talegenkendelse til en del af hverdagen. Ny algoritme, fra forsker ved Købehavns Universitet og internationale kollegaer, gør det for første gang muligt at tale med ”Siri” og andre digitale assistenter uden internetforbindelse. Med opfindelsen vil talegenkendelse kunne bruges hvor-som-helst, men også når sikkerheden er højeste prioritet.

Ny patenteret algoritme gør talegenkendelse muligt, selv hvor kragerne vender – og på flyet hjem igen. Foto: Getty

Engang var det science fiction, at tale med en computer. I dag er det hverdag for mange at sige ”hej Siri”, ”Alexa” eller noget tredje til sit smartphone eller digitale assistent i hjemmet. Alligevel kan talegenkendelse få en endnu større rolle i fremtiden.

Hvor globale undersøgelser har vist, at hvor hver fjerde allerede bruger teknologierne jævnligt, så vil antallet af enheder, der har talegenkendelse, overstige antallet af mennesker på planeten i 2025, hvis forudsigelserne holder stik. Og teknologien udvikler sig stadig.

Indtil nu har funktionen været begrænset til enheder tilsluttet internettet. Det skyldes, at den algoritme, der normalt styrer processen, kræver en stor midlertidig hukommelse (RAM). Derfor har datacentrenes store servere holdt hånden under teknologien via internettet. Man kan selv teste det ved at sætte sin smartphone på ”flyfunktion” og konstatere, at ingen er hjemme, når man taler til den. Men det kan ændre sig nu.

Med en ny algoritme, opfundet af Professor Panagiotis Karras fra Datalogisk Institut ved Københavns Universitet, og udviklet i samarbejde med sprogforsker Nassos Katsamanis fra Athena Research Center i Grækenland og forskere fra Aalto Universitet, Finland, og KTH i Sverige, kan selv mindre computere som smartphones nu blive udstyret med software, der er i stand til at afkode vores tale uden det store behov for hukommelse – uden behov for internetadgang.

Koden, der fornyligt blev præsenteret i en videnskabelig artikel, benytter sig af et smart trick for at undgå det: Den glemmer det, den ikke skal bruge nu og her.

– Talegenkendelse fungerer grundlæggende ved, at de små lyde, som vi danner ord og sætninger med, kaldet fonemer, bliver matchet med et bibliotek af tilsvarende lyde. Der beregnes sandsynligheder for et match og for de efterfølgende kombinationer, som danner vores ord og sætninger. De mest sandsynlige sekvenser beregnes på den måde, og softwaren oversætter således lydene til tekst, ”forklarer Panagiotis Karras.

Men med de nuværende algoritmer kræver processen mere og mere hukommelse, jo længere det talte er, fordi alle alternative kombinationer skal holdes åbne, til den sidste lyd er blevet analyseret. Det er det, den nye algoritme gør op med.

– Den algoritme, Panos udtænkte, og som vi har udviklet, kan noget helt nyt. I modsætning til den kode, der har været den gyldne standard siden talegenkendelens tidligste dage, gemmer den kun en brøkdel af arbejdet, der fungerer som en slags ”koordinater”. Med dem kan den genskabe hele sekvensen, den har fortolket, og resultatet er talegenkendelse, der ikke kræver nær samme RAM, forklarer medudvikler og medforfatter til forskningen, Nassos Katsamanis.

Fra simple ”keywords” til lange sætninger

Den manøvre kan lyde enkel, men involverer unik kode, som ikke før er set, og som forskerne bag har søgt patent på. Algoritmen er den i stand til at mindske den afgørende hukommelse, uden at det går ud over kvaliteten af talegenkendelsen. Den kræver smule mere tid og regnekraft end tidligere processer, men det er ubetydeligt sammenlignet med de muskler, moderne enheder har, forsikrer forskerne.

Og så er den altså i stand til at gøre det uden internetforbindelse, hvilket gør talegenkendelse – og på sigt også oversættelse af hele sprog, håber forskerne – muligt hvor-som-helst, selv i Amazonas dybeste jungle.

Når den nuværende software må opbevare disse alternative sekvenser og biblioteker af potentielle lydtolkninger, så er det egentligt relativt uproblematisk, når opgaven er enkelte ord og ganske korte sætninger. Men jo længere sætninger, der er tale om, desto mere kompleks bliver de potentielle kombinationer, og dermed stiger behovet for RAM.

– I dag er det muligt for visse små devices, at genkende og handle ud fra nogle få ord uden at være på nettet. Smart home-systemer kan forstå enkelte ”keywords” som ”tænd” og ”sluk”. Det kalder man for small-vocabulary speech recognition. Med vores algoritme vil de kunne genkende lange instruktioner – i princippet hele sprog, uden internetforbindelse. Det kaldes large-vocabulary speech recognition, siger Panagiotis Karras.

Bedre inklusion, sikkerhed og energibesparelse

Opfindelsen fører, ifølge forskerne, mange muligheder med sig. Den har fordele, som er både praktiske, sikkerhedsmæssige og samfundsmæssige. Og så er der et stort energibesparende potentiale.

Mange ville kunne få glæde af, at man fortsat vil kunne få hjælp til fx oversættelse af fremmede sprog på rejser, også uden for internettets rækkevidde, og den mulighed håber forskerne på sigt at realisere. Men samfundspotentialet for den sproglige tilgængelighed nu og på sigt er langt større end det.

– Denne algoritme kan være med til at udbrede sprogteknologi og gavne demokratisering ved at gøre information mere tilgængelig. At gøre oversættelsesværktøjer og taleassistenter tilgængelige, uanset om man befinder langt fra internettet, betyder, at flere vil kunne deltage i samfundet. Det giver blandt andet mennesker uden skriftsprog eller med fysiske handicap nye muligheder for at forstå og påvirke samfundets beslutninger, siger Nassos Katsamanis

Et andet aspekt af opfindelsen er sikkerheden i forbindelse med talegenkendelse. Er sikkerheden ens højeste prioritet, kan den nye algoritme løse et vigtigt problem: Internet-opkoblinger kan hackes. Den nye algoritme øger sikkerheden ved at fjerne behovet for at være tilsluttet internettet.

Samtidigt er energiforbruget i de store datacentre, som understøtter den nuværende teknologi, måske usynlig for den enkelte forbruger, men yderst relevant at reducere i en tid med klimaforandringer. Her kan den hurtigt voksende talegenkendelses-teknologi spare stort ved at undgå det store behov for midlertidig hukommelse.

– Det er vigtigt at reducere energiforbruget for at mindske afhængigheden af fossile brændstoffer, da der fortsat er datacentre, som er drevet af sådanne energikilder,” lyder det afsluttende fra Panagiotis Karras

Bag studiet

Følgende forskere har medvirket til projektet:
Martino Ciaperoni
Athanasios (Nassos) Katsamanis
Aristides Gionis
Panagiotis Karras

Kontakt:
Panagiotis Karras, Datalogisk Institut, Københavns Universitet, mail: paka@di.ku.dk

Skrevet i: Design & udvikling, Wireless & data

Seneste nyt fra redaktionen

Infineon introducerer portefølje af strålingstolerante memories til LEO-missioner

Komponenter & konnektorer19. 06. 2025

Næsten 10.000 satellitter kredser i øjeblikket om vores planet i lav jordbane (Low Earth Orbit - LEO) og leverer internetadgang, jordobservation, kommunikation, vejrinformation og flere data tilbage til jorden. Sammenlignet med traditionelle geostationære jordbanesystemer (GEO) opsendes

Mascot lancerer næste generations smarte batterioplader – 80W modellen 4340

Power19. 06. 2025

Strømforsyningsspecialisten Mascot præsenterer sin seneste innovation: Model 4340, en næste generations højeffektiv batterioplader, udviklet til bly-syre-, Li-Ion-, LiFePO4- og NiMH-batterier. 4340 er konstrueret til maksimal ydeevne og pålidelighed og bruger en mikrocontroller-styret 3-trins

Seks startups dyster om titlen som Europas bedste robotvirksomhed – tre er danske

AktueltDesign & udviklingEvents19. 06. 2025

Finalisterne er nu fundet til "Europe's Best Robotics Startup Challenge", der løber af stablen den 25. juni som en del af teknologi- og industrimessen Automatica i München 24. til 27. juni. Tre af finalisterne har adresse i Danmark. Seks af Europas mest lovende robotvirksomheder vil præsentere

Ny svindelbølge rammer danske elkunder

BranchenytWireless & data19. 06. 2025

Danmarks største energiselskab advarer alle danske elkunder mod en ny svindelbølge, der lige nu misbruger Andel Energis navn og logo. "Vær skeptisk" og "tjek dine elregninger grundigt," lyder opfordringen til Andel Energis ca. 1 million elkunder. ”Du risikerer at få lukket for din

Planetarium åbner banebrydende ny udstilling midt i opgør om fremtidens magtbalancer

Events19. 06. 2025

I en spektakulær totaloplevelse iscenesat med teknologi, kunst og videnskab løfter Planetarium blikket mod fremtiden og spørger: Hvordan undgår vi, at rummet bliver den næste frontlinje for konflikter og er det muligt at opnå kontrol, når der fortsat er mange stater, som ikke ønsker at underskrive

Call for papers til EOT – Electronics of Tomorrow

Design & udviklingEventsProduktionTop19. 06. 2025

MCH, der afholder EOT - Electronics of Tomorrow samtidig med HI Tech & Industry 2025 i dagene mellem 30. september og 2. oktober, opfordrer elektronikbranchens specialister til at præsentere praktiske løsninger både i messens forum og som en del af konferenceprogrammet. Årets tema på EOT -

Danske forskere og virksomheder vil kvantesikre fremtidens cybersikkerhed

AktueltWireless & data19. 06. 2025

Inden for få år forventes de første kvantecomputere at kunne bryde de krypteringsmetoder, der i dag beskytter alt fra sundhedsdata til finansielle transaktioner. Innovationsfonden investerer 25,9 mio. kr. i et nyt banebrydende kvanteteknologisk projekt, designet til at udvikle verdensførende

Power-over-coax spole til filtre med brancheførende effektivitet

Komponenter & konnektorer18. 06. 2025

TDK Corporation lancerer ADL8030VA, en højtydende SMD-spole designet specifikt til power-over-coax (PoC) applikationer. På grund af sin høje impedans over et bredt frekvensområde strømliner denne komponent PoC-filterdesignet ved kun at kræve én enkelt komponent i stedet for den konventionelle

Nyt salgskontor i Odense skal sikre plads til fremtidig vækst for Desitek

Branchenyt18. 06. 2025

Som led i en strategisk vækstplan har Desitek valgt at udvide sine fysiske rammer og flytte hele salgsafdelingen til nye lokaler. Flytningen til Cortex Park vest i Odense berører 14 medarbejdere, mens administration, lager og serviceafdeling forbliver på den eksisterende adresse i Søndersø, som

Hvad nu hvis fem måneder kunne ændre alt for din start-up?

Design & udviklingEventsTop18. 06. 2025

Dørene til Danish Tech Challenge er nu officielt åbne - og hvis du bygger en hardware-startup, kan dette være din mulighed for at accelerere din forretning, forfine dit produkt og komme i kontakt med investorer og brancheførende mentorer. Åh, og nævnte vi det? Vinderen stikker af med 500.000 kr. og

Tilmeld Nyhedsbrev

Tilmeld dig til dit online branchemagasin/avis

 
 
 
 
Aktuel Elektronik - underleverandøroversigt
Få fuld adgang til indlægning af egne pressemeddelelser… Læs mere her

/Nyheder

  • Mouser Electronics

    Now at Mouser: Infineon PSOC Control C3 Microcontrollers for Next-Generation Motor Control Applications

  • Microchip Technology Inc.

    Microchip Enhances Digital Signal Controller Lineup with Industry-Leading PWM Resolution and ADC Speed

  • Mouser Electronics

    Mouser Electronics Wins 2024 EMEA OEM Distributor of The Year Award from Digi International Inc.

  • Power Technic ApS

    DPU 3200W Strømforsyning

  • InnoFour

    Polarion ALM 2506 – What’s new and noteworthy

  • Phoenix Contact A/S

    Farvede RJ45 patchkabler til CAT6A applikationer

  • Eaton

    Tabula: En klassiker inden for lavspændingsdistribution

  • Rohde & Schwarz Danmark A/S

    R&S FSWP phase noise analyzer and VCO tester now supports up to 56 GHz and external signal sources

  • Beckhoff Automation ApS

    Energiomlægningen kræver omfattende måleteknologi

  • Power Technic ApS

    MPQ60W konverter til medicinsk og hjemmepleje applikationer

Vis alle nyheder fra vores FOKUSpartnere ›

Seneste Nyheder

  • Infineon introducerer portefølje af strålingstolerante memories til LEO-missioner

    19.06.2025

  • Mascot lancerer næste generations smarte batterioplader – 80W modellen 4340

    19.06.2025

  • Seks startups dyster om titlen som Europas bedste robotvirksomhed – tre er danske

    19.06.2025

  • Ny svindelbølge rammer danske elkunder

    19.06.2025

  • Planetarium åbner banebrydende ny udstilling midt i opgør om fremtidens magtbalancer

    19.06.2025

  • Call for papers til EOT – Electronics of Tomorrow

    19.06.2025

  • Danske forskere og virksomheder vil kvantesikre fremtidens cybersikkerhed

    19.06.2025

  • Power-over-coax spole til filtre med brancheførende effektivitet

    18.06.2025

  • Nyt salgskontor i Odense skal sikre plads til fremtidig vækst for Desitek

    18.06.2025

  • Hvad nu hvis fem måneder kunne ændre alt for din start-up?

    18.06.2025

Alle nyheder ›

Læs Aktuel Elektronik

Aktuel Elektronik avisforside

Annoncér i Aktuel Elektronik

Medieinformation

KONTAKT

TechMedia A/S
Naverland 35
DK - 2600 Glostrup
www.techmedia.dk
Telefon: +45 43 24 26 28
E-mail: info@techmedia.dk
Privatlivspolitik
Cookiepolitik