Den nye kunstige intelligens af bilstereo kan muligvis forbedres mere end bare melodier

Hollywood har evigt portrætteret kunstig intelligens (AI) som det operationelle lag af dystopiske robotter, der erstatter intetanende mennesker og skaber den eskalerende, centrale konflikt. I bedste tilfælde kan du forestille dig en ung Hailey Joel Osment, der spiller David, den selvbevidste, kunstige knægt i Spielbergs polar-kasketter-optøede-og-oversvømmede-kystbyer (lyder det bekendt?) AI: Kunstig intelligens der (spoiler alert) kun dræber sig selv. Eller måske husker du Robin Williams stemme som Robotmennesket som endnu en gang er en selvbevidst robot, der forsøger at trives, og som (igen på spoileralarm) ender med at blive hans eneste offer. Og selvfølgelig er der den næsten klichémæssige reference til Terminator og dens post-apokalyptiske verden med maskiner, der forsøger at ødelægge mennesker og, ja, (ikke så spoiler alert) masser af ofre over et par årtier. I ingen af ​​disse scenarier sameksisterer mennesker dog med et forbedret liv, endsige forbedret underholdning og sikkerhed.

Det er imidlertid den nye virkelighed. Kunstig intelligens-algoritmer kan inkluderes i lyddesign og løbende forbedres via trådløse opdateringer for at forbedre køreoplevelsen. Og i direkte modstrid med disse Hollywood-eksempler kan en sådan kunstig intelligens faktisk forbedre menneskets sandsynlighed for at overleve.

Bare for fornøjelsens skyld

Indtil for nylig har al brugergrænseflade (UI) inklusive lydudvikling krævet kompleks programmering af ekspertkodere i løbet af de standard seksogtredive (36) måneder af et køretøjsprogram. Styling af metalplader og elektroniske kasser er specificeret, indkøbt og udviklet parallelt kun for at kalibrere individuelle elementer sent i udviklingen. Brandede lyde. Akustiske signaturer. Alle separate initiativer inden for samme, anæmiske systemdesign, der har koster producenterne milliarder.

Men kunstig intelligens har muliggjort en langt mere fleksibel og effektiv måde at nærme sig lydoplevelsesdesign på. "Det, vi ser, er konvergensen af ​​trends," siger Josh Morris, DSP Concepts Machine Learning Engineering Manager. "Lyd er ved at blive en mere dominerende funktion inden for bilindustrien, men samtidig ser du, at moderne processorer bliver stærkere med mere hukommelse og flere muligheder."

Og deri, ved hjælp af en systemfokuseret udviklingsplatform, giver kunstig intelligens og disse stærkere processorer chauffører og passagerer et nyt niveau af adaptiv reaktionsevne i realtid. . "I stedet for det historiske behov for at skrive bunker af kode til alle tænkelige scenarier, guider AI systemets reaktionsevne baseret på en indlært bevidsthed om miljøforhold og begivenheder," siger Steve Ernst, DSP Concepts Head of Automotive Business Development.

Den meget indlysende måde at bruge et sådant læringssystem på er at "dæmpe støjen" af køretøjet, så premium lyd kan skræddersyes og forbedres på trods af, at der er skiftet til vinterdæk eller andre sådanne ændringer i omgivelserne. Men LG Electronics har udviklet algoritmer, der kører i DSP Concepts Audio Weaver platform for at tillade stemmeforbedringer af filmens dialog under bagsædeunderholdning for at fremhæve den i forhold til eksplosioner i filmen, og derved give passageren mulighed for bedre at høre det kritiske indhold

Et andet ikke-oplagt aspekt ville være, hvordan brandede lydlyde orkestreres midt i andre lyde. Kræver dette specifikke køretøj den eskalerende opstartssekvens for at afspille, mens andre lyde som radio og klokkespil automatisk slås ned? Hver oplevelse kan justeres.

Mere tilbøjelige til at trives

Efterhånden som verden kører ind i både elektriske køretøjer og autonom kørsel, vil hyppigheden og behovene for hørbare advarsler sandsynligvis ændre sig drastisk. For eksempel kan en autonom taxas sikkerhedsingeniør ikke antage, at passagererne er i nærheden af ​​et visuelt display, når en rettidig advarsel er påkrævet. Og hvor hørbar er den advarsel for næsten 25 millioner amerikanere med handicap For hvem skal autonome køretøjer åbne nye mobilitetsmuligheder? "Lyd er nu ikke kun til at lytte til din yndlingssang," fastslår Ernst. "Med autonom kørsel er der alle mulige advarsler, der er nødvendige for at holde chaufføren engageret eller for at advare den ikke-engagerede chauffør om ting, der foregår omkring dem."

"Og hvad der gør det mere udfordrende," siger Adam Levenson, DSP Concepts' marketingchef, "er alle de ting, der håndteres samtidigt i bilen: telefoni, fordybende eller rumlig lyd, motorstøj, vejstøj, akustiske køretøjsalarmsystemer, stemmesystemer osv. Vi kan godt lide at sige, at det mest komplekse lydprodukt er bilen.”

Forestil dig for eksempel scenariet, hvor en chauffør har aktiveret autonom køretilstand på motorvejen, har skruet op for sine melodier og er behageligt uvidende om et udrykningskøretøj, der nærmer sig. Ved hvilken nøjagtighed (og afstand) af sirene-detektion ved hjælp af køretøjets mikrofon(er) advarer bilen sin næsten distraherede chauffør? Hvordan skal denne advarsel præsenteres for at overvinde omgivende støj, give tilstrækkelig opmærksomhed, men ikke unødigt forskrække føreren? Alt dette kan tunes via præ-udviklede modeller, forudgående træning med forskellige sirener og efterfølgende cloud-baseret tuning. "Det er her, den overordnede orkestrering bliver virkelig vigtig," forklarer Morris. "Vi kan tage output fra [AI's detektion]-modellen og dirigere det til forskellige steder i bilen. Måske skruer du ned for lyden, udløser et lydsignal og blinker noget på instrumentbrættet, så føreren kan være opmærksom."

Det samme gælder for eksterne alarmer. For eksempel kan stille elektriske køretøjer have indstillet alarmer til fodgængere. Og så nye kalibreringer kan oprettes offline og downloades til køretøjer som softwareopdateringer baseret på den aktiverede innovation.

Innovation overalt. Og kunstig intelligens nærer den utopiske oplevelse i stedet for at skabe Hollywoods dystopiske verden.

Forfatterens forudsigelse

Her er min forudsigelse af ugen (og det er kun tirsdag, folkens): den næste evolution af lyd vil omfatte en fuld, øjeblikkelig feedback-loop inklusive den subtile, realtids-brugernes glæde. Ja, meget af det nuværende design forbedrer sandsynligvis oplevelsen, men en løbende kalibrering af User-Centered Design (UCD) kan blive yderligere forbedret baseret på passagerernes udtryk, kropssprog og kommentarer, og derved individuelt justere tilfredsheden i realtid. Alle aktivererne er der: kamera, AI, processorer og en adaptiv platform.

Ja, det har vi hørt om før adaptiv stemningsbelysning og fjerndetektering af kedsomhed, stress osv. for at forbedre sikkerheden, men intet, der forbedrer den kombinerede oplevelse baseret på realtidsindlæringsalgoritmer for alle brugerpegede sensorer.

Måske ekstrapolerer jeg for meget. Men ligesom Robin Williams' karakter har jeg strakt mig over to århundreder … så måske er jeg også bare følsom over for, hvad mennesker måtte ønske.

Kilde: https://www.forbes.com/sites/stevetengler/2022/09/13/the-new-artificial-intelligence-of-car-audio-might-improve-more-than-just-tunes/