Mange virksomheders IT er under pres for at kunne yde forudsigelig ydelse med lav latency i stadigt mere dataintensive applikationer. Især inden for AI er en effektiv QoS (Quality of Service) for datalagringen blevet vital. Uden robust QoS-styring kan en delt infrastruktur medføre mispasning af ressourcer, uforudsigelig langsom dataafvikling og dårlig skalérbarhed
Artiklen har været bragt i Aktuel Elektronik nr. 5 – 2026 og kan læses herunder uden illustrationer
(læs originaludgaven her)
Af Jason Chien, senior direktør for entreprise-divisionen, Silicon Motion
QoS – Quality of Service – giver en lang række virksomheder netop den kontrol, de behøver for at allokere datalagringsressourcer med høj præcision, balancering af arbejdsbelastninger og opretholdelse af en solid konsistens i datasystemernes ydelse. I AI-pipelines, hvor modeltræning, inferens og databevægelser er tæt koblet sammen, sikrer QoS en høj systemeffektivitet, præcision og pålidelighed.
QoS har længe været en hjørnesten i datalagring hos virksomheder. Ved at opstille grænseværdier for throughput og IOPS (Input/output Operations Per Second) kan man forhindre, at applikationer med lavere prioritet forringer ydelsen i de mere kritiske arbejdsopgaver. QoS tillader også en strategibaseret styring, der sikrer, at serviceniveauer bliver opretholdt på tværs af delte dataplatforme og virtualiserede miljøer.
Automation bidrager med endnu et værdilag. Ved at reducere behovet for manuel indgriben sikrer automatiseret QoS en forudsigelig ressource-allokering med forenklet skalering, ligesom it-teams slipper for at skulle fokusere på langsigtet planlægning af infrastrukturen.
I AI-opgaver vokser betydningen af QoS markant. Modeltræning og inferens kræver en stram I/O-konsistens, og selv mindre latency-spikes kan reducere den optimale GPU-anvendelse og underminere den overordnede effektivitet. En pålidelig QoS er derfor fundamentet for missionskritiske applikationer som medicinsk diagnostik, detektering af svindel og autonome systemer.
I/O-konsistens i AI-pipelines
I/O-konsistens er blandt de vigtigste aspekter i QoS for AI. Machine learning-systemer afhænger af stabile dataafleveringer for at kunne opretholde præcisionen. Forsinkelser, ukomplette reads eller mismatchede inputs kan forårsage outputs med fejl.
Stabile I/O’er forhindrer GPU’er og acceleratorer i at gå i tomgang, mens de venter på data, og det sikrer såvel ydelsen som energieffektiviteten i et datasystem. Det sikrer samtidigt compliance med både forretningsmæssige og regulatoriske krav gennem en sikring af dataintegriteten ved absorption, træning og anvendelse af strukturer.
Uden et robust QoS er et systems AI-pipelines følsomme over for ustabilitet. Med QoS kan virksomheder derimod skabe et pålideligt fundament for forretningens højværdiapplikationer.
Teknikker til styring af QoS
Datacentre bruger en række teknikker til at styrke deres egen QoS, hver især designet til at balancere såvel ydelsen som en rimelig fordeling af de enkelte arbejdsopgaver:
● Strategisk styring: Definition af minimum og maksimum throughput for lagringsobjekter eller brugere.
● Datarate-begrænsning og garanterede minima: Forhindrer arbejdsopgaver i at monopolisere ressourcerne og sikrer en god baseline-ydelse.
● Prioritering og isolation: Allokerer den højere prioritet til latency-følsomme processer og isolerer ”støjende naboer”.
● Dynamisk skalering: Justering af lofter og gulve i real-time baseret på karakteristika for arbejdsopgaverne.
● Trafikudformning og køer: Styring af I/O-flowet for at forhindre flaskehalse og med favorisering af kritiske arbejdsopgaver.
● Monitering og stramning: Tracking af IOPS, throughput og latency for en automatisk korrigering i henhold til virksomhedsstrategi.
● Multibrugerstyring: Anvendelse af finkornede strategier i forhold til individuelle brugere eller volumener for opfyldelse af serviceniveauaftaler (SLA).
● Softwaredefineret QoS: Brug af I/O-klassificering og lån af tokens for tilpasning til skiftende behov.
● Automation: Strømlining af storskala-implementering ved volumentunge opdateringer og selvbetjent provisionering.
Samlet set giver disse punkter en forudsigelig ydelse, SLA-opfyldelse og en prisoptimal skalering.
QoS i SSD’er og NVMe’er
Virksomheders SSD-løsninger indeholder typisk QoS-funktioner, der især er relevante for AI-arbejdsbelastninger:
● Latency-forudsigelighed: Garanterer, at en defineret procentdel af I/O’erne bliver udført inden for en given målsat tid.
● Konsistent IOPS: Opretholder stabilt output selv under tunge arbejdsopgaver.
● Styring af baggrundsopgaver: Styrer ”affaldssortering” og fordeler sliddet uden forstyrrelse af opgaverne i forgrunden.
● Styring pr. bruger: Supporterer isolering og rimelig fordeling på tværs af applikationer og containere.
● Overprovisionering og firmware-optimering: Opretholder ydelsen over tid, i takt med at drev bliver fyldt op og ældede.
NVMe-protokollen styrker disse punkter gennem parallelitet og kø-separation. Ved support af multiple samtidige I/O-streams og gennem mapping af SLA’er til konfiguration af køer gør NVMe både throughput og latency lette at forudsige – selv for blandede eller højt belastede AI-pipelines.
Dataplacering og QoS
QoS kan ikke adskilles fra dataplacering. AI-ydelsen afhænger af både nærhed og tilgængelighed af data. Lagring af datasæt på systemer med en høj latency eller fjerntliggende ditto kan skabe flaskehalse i pipelinen, mens lokale, højtydende lagringsmedier sikrer hurtig respons og effektivitet.
Teknologier som Flexible Data Placement (FDP) gør værtsprocessorer i stand til at guide SSD’er til, hvordan data skal skrives (write), reducerer write-forstærkningen og forbedrer systemets endurance. Koblet sammen med intelligente QoS-strategier medfører dét, at kritiske AI-datasæt forbliver tilgængelige med minimale delays.
Automatiserede systemer udbygger nu princippet yderligere. Ved migration eller replikering af data, dynamisk baseret på arbejdsopgavernes behov, kan systemerne tilpasse sig skiftende behov og sikre konsistens i distribuerede datamiljøer.
Performashape-teknologi
Performashape introducerer en firmware-defineret, hardware-accelereret ydelsesudformning (i mangel af et bedre dansk ord for ”performance shaping”) direkte i SSD-controlleren. Den supporterer et stort antal QoS-grupper, der hver især kan være bundet op mod en bruger som en applikation, en virtual machine eller et namespace. Inden for hver gruppe styrer Performashape specifikke arbejdsopgaver som sekventielle throughputs, random IOPS eller blandede mønstre i henhold til konfigurérbare strategier.
Fordelene inkluderer:
● Optimeret ydelse for arbejdsopgaverne: Multitrins udformningsalgoritmer er skræddersyede til AI-pipelines og andre krævende bruger-cases.
● Konsistent QoS: Reducerer fluktuationer gennem styring af read/write-ydelsen på brugerniveau.
● Isolation af arbejdsopgaver: Giver beskyttelse mod støjende naboer og sikrer en forudsigelig ydelse for hver virtual machine eller container.
● Ressourceeffektivitet: Udglattede I/O-mønstre maksimerer anvendelse af den rådige båndbredde og kapacitet.
● Næste generations NAND-support: Integration med PCIe Gen5, NVMe 2.0-controllere og avancerede QLC NAND-funktioner som FDP.
● Pålidelighed og sikkerhed: Drift sammen med beskyttelse af datastierne, hardware-isolering og sikkerhed på virksomhedsniveau.
Ved at embedde avanceret QoS direkte i memory-laget gør Performashape virksomheder i stand til at opnå højere throughputs, lavere latency og forudsigelige serviceniveauer i multibruger AI-miljøer.
Konklusion
AI-arbejdsbelastninger kræver mere af deres lagringsmedier end nogensinde før. Forudsigelig latency, konsistente throughputs og en effektiv ressourceanvendelse er nødvendigheder, hvis virksomheder vil opnå både præcision og skalérbarhed i deres datasystemer.
QoS er fortsat fundamentet for at opfylde disse krav, mens innovation inden for SSD’er, NVMe’er og intelligent dataplacering fortsætter udvidelsen af, hvad der tidligere var muligt. Ydelsesudformningsteknologier tilføjer endnu en dimension i form af finkornet, hardware-accelereret QoS, som sikrer, at AI-pipelines kører effektivt, pålideligt og skaleret til opgaverne.
Billedtekster:
1: QoS og Silicon Motions Performashape-teknologi kan bruges i datacentre til optimering af throughputs, minimering af latency og en bedre ressourcefordeling i forhold til opgavernes kritiske niveauer direkte i lagringsmedierne/SSD’erne.
2: Ydelsesudformningens betydning for read- og write-processerne ud af og ind i lagringsmedier ved brug af Performashape.

