Testmetoder: Hvordan vores tests og grafer skal læses - FlatpanelsDK
Test af TV

Testmetoder: Hvordan vores tests og grafer skal læses

29 Oct 2015 | Torben Rasmussen (@flatpanelsdk) |

I denne artikel beskriver vi lidt nærmere hvilke testmetoder der benyttes i forbindelse med vore anmeldelser, herunder også hvilket udstyr og hvilken software vi benytter. Vi forklarer også hvordan vores grafer skal læses. Overordnet set forsøger vi at holde vore anmeldelser på et niveau, som de fleste kan være med på og som ikke bliver unødigt tekniske. Vi skriver ikke anmeldelser for teknik-nørderne - vi skriver til alle der måtte have interesse i at købe sig en ny fladskærm til hjemmet og som gerne vil have en uvildig vurdering at læne sig op ad.

Hvis du ikke allerede har set vores tidligere artikel omkring "det forkerte billede", så bør du besøge dén for at se et par af de scenarier vi kæmper imod når der testes skærme og billedkvalitet.

Standarder

Ligesom i mange andre brancher, bruger man i film og tv-branchen standarder, som skal sikre, at billedet, der optages med kameraet og redigeres i studiet gengives på samme måde på biograflærredet og hjemme på stue-tv’et.

I filmbranchen har man - indtil nu - benyttet en standard, når man efterbehandlede film i studiet, som beskriver hvordan farverummet for eks. en Blu-ray film bør se ud. Dette farverum hedder for hjemmebrug i gængs terminologi “Rec.709” og definerer hvordan farverne skal se ud, såsom hvilken farvetemperatur hvid skal have og hvor rød den røde farve skal være. I biograferne bruger man det lidt større ”DCI-P3” farverum.

Farverum er faste og veldefinerede og når vi måler TV og monitors sammenligner vi det med Rec.709 standarden. Med indtoget af 4K er man begyndt at tale om at udvide farvespektret på tv-skærme i hjemmet fra Rec.709 til DCI-P3 eller Rec.2020, som begge byder på et langt større farvespektrum end Rec.709. Et større farvespektrum kræver dog, at filmen, der vises, er optaget og redigeret til dette farverum også, da du ellers vil få vist billedet helt forkert. Pt. er der stort set intet forbrugermateriale tilgængeligt i nogen af de to større farverum og der er også ret få fladskærme i 2015, som understøtter dette udvidede farverum, så man kan sige, at vi kun har set den spæde start på at erstatte Rec.709.

Læs også vores baggrundsartikel om Ultra HD og større farverum

Ud over hvordan farverne skal se ud for at give den rigtige hudfarve, er der også noget der hedder “gamma”, hvilket essentielt beskriver hvor lyst eller mørkt et billede skal se ud. Hvis man tænker på gråtone-skalaen, så handler det om hvor hurtigt tingene går mod hhv. sort og hvid og en høj gamma vil betyde, at billedet bliver mørkere og en lav gamma betyder at billedet ser lysere ud - eller i andre termer: høj gamma betyder mørke skygge-detaljer og lav gamma betyder lysere skygge-detaljer. Vi sigter generelt efter en gamma-værdi på 2.2, hvilket giver en god balance mellem detaljer i skyggerne uden at billedet bliver udvasket. Det er dog i høj grad et spørgsmål om smag, og vi ved at mange andre test-sites sigter efter en lidt højere gamma.

Testudstyr og software

For at indstille farverne på de skærme, som vi tester, skal der måleudstyr til. Indstilling - eller kalibrering - kan ikke gøres på øjemål, da det menneskelige øje er alt for let påvirkelig af omgivelserne til at kunne fintune et helt farvespektrum.

Til at måle farverne og sammenligne dem med det farverum der kalibreres op imod, bruger vi en sensor beregnet til at måle lys. Der findes forskellige typer af disse sensorer, som måler lyset og farverne på forskellig vis og de kommer i vidt forskellige prisklasser - lige fra få hundrede kroner til adskillige tusinde kroner. Man deler typisk de to typer i spectrophotometre og colorimetre, hvor førstnævnte typisk findes i laboratorieudstyr, da det er super præcist til at måle farvesammensætninger ved at se på alle bølgelængderne, og sidstnævnte er gearet til at måle RGB-komponenter alene. Vores måleudstyr er af colorimeter-typen og vi har god portion af dem efterhånden. Dem vi bruger nu kommer fra firmaet X-Rite, hvor vi har en i1 Display Pro og en Color Munki Display. Som software til at håndtere målingerne bruger vi CalMAN Ultimate fra Spectracal, som kan forsynes med testmønstre fra eks. en Chromecast, et AppleTV, en USB-stick med dedikerede videofiler eller et HDMI-kilde med de rette videofiler. Læs mere om CalMAN her: www.spectracal.com.



Du kan læse et par af vores tests af disse sensorer her:
X-rite ColorMunki Display
Spyder TV
Spyder Elite 3

Læs også vores artikel om kalibrering her.

For at måle input-lag, dvs. den forsinkelse der er mellem det input en skærm modtager og det billede der vises på skærmen, bruger vi en metode, som stort set alle i branchen har satset på nu, nemlig den famøse Leo Bodnar Input Lag Tester. Der er tale om et meget simpelt stykke udstyr, som har én knap, én HDMI-udgang og én lyssensor pakket ind i en æske der kun har ét formål: At måle hvor lang tid der går fra et signal forlader boksen til det billede den genererer, kan måles af lyssensoren på skærmen igen. Det er et vigtigt tal for spil-entusiasterne for det beskriver hvor meget forsinkelse de kan forvente når de bevæger eks. en person i et first-person-shooter-spil med spilcontrolleren - og her kan millisekunder være forskellen på liv og død :-)

På monitors er der den seneste tid dukket nogle nye mere ergonomiske skærme op, som gør op med den Pulse-Width-Modulation (PWM) teknik man hidtil har benyttet til at justere lysniveauet fra LED-bagbelysningen på monitors. PWM er en teknik hvor lyset pulseres, dvs. blinker, i meget højt tempo, hvilket øjet ikke er bevist om, men som desværre belaster synet en del og er kilde til en del problemer hos visse personer.

For at teste om en skærm bruger PWM (og hvilken frekvens skærmen i så fald bruger), så skal man såmænd blot bruge et kamera hvor lukketiden kan styres manuelt. Her knipses et billede af en sort baggrund med en hvid bjælke med eks. en lukketid på 1/50 s imens kameraet bevæger i en støt bevægelse fra en side til den anden og så vil bjælken optræde i et antal skygge-billeder som følge af belysningens pulsering. Ved at tælle antallet af duplikater kan man da udregne frekvensen af belysningen som “Antal streger x 1/lukketid”. Det kan tage lidt tid at mestre teknikken, men det er relativt simpelt at udføre.

Læs også hvorfor flimmer på skærme kan give hovedpine

Den mere præcise metode er naturligvis at bruge et oscilloskop og en photodiode, men i vores tilfælde er vi egentlig mest interesserede i at afgøre om der bruges PWM eller ej og ikke i at bestemme frekvensen som sådan.

Til måling af effektforbruget bruger vi en simpel “Spar-o-meter” fra El-sparefonten, som udmærker sig ved, at den er i stand til at håndtere switch-mode strømforsyninger, dvs. strømforsyninger som er gearet til at køre på både 120 V og 220 V. Visse typer billige elmålere har førhen haft problemer med dette, hvilket gav et ret forkert resultat når effektforbruget blev lavt, hvilket er et problem ved måling af standby-forbrug.

De billeder du ser i vore artikler forsøger vi at få skudt i så professionel en kvalitet som muligt, men i visse situationer må vi tage til takke med det vi har ved hånden, hvilket især vil gå ud over de demo-videoer vi smider i visse anmeldelser.

Ambitionen er dog, at skyde alt med DSLR-kameraudstyr, og efterbehandle materialet, så det bedst muligt afspejler de forhold der gjorde sig gældende under testen - dvs. eksponering og farvegengivelse forsøges tilpasset, så det afspejler virkeligheden. Der er naturligvis situationer, hvor overdrivelse er målet i sig selv, hvilket eks. er tilfældet når vi laver billeder af clouding og artefakter på skærmene.

Testmønstre og filmsekvenser

For at vurdere de mere subjektive aspekter af billedkvaliteten, så har vi naturligvis også en lang række af testmønstre, som er udviklet med ret specifikke mål for øje. De kunne eks. bruges til at give en visuel vurdering af skyggedetaljer, banding i gradienter, bevægelsesopløsning og dirty-screen-effect (DSE). Andre er gode til at vurdere pixelmapping og skarphedsindstillingen på et TV.

Der findes også mønster-generatorer, som er en enhed med et HDMI-output, som har det ene formål at sende specifikke testmønstre i forskellige opløsninger og båndbredder ud, så man kan teste hvilke signaler et TV kan modtage, men da dette udstyr forholdsvist omkostningsfuldt (ca. 10.000 DKK) så har vi pt. ikke noget sådant i folden.

Til test af 4K på de nyeste modeller, så er det pt. ret begrænset med materiale på markedet og hvis man vil have klip i høj kvalitet må man nøjes med demoer. Til jer med en 4K skærm, som ikke er helt overbevist omkring herlighedernem der kan trækkes ud af deres TV, så kan det anbefales at kigge forbi demo-uhd3d.com/, hvor du også kan finde HDR-klip (om end ret korte).

De mest sprøde 4K-demoer vil nok være time-lapse-versionerne, da hvert eneste frame er et still-billede taget i meget høj opløsning. Find eksempelvis LG’s “Villes de nuit” eller Samsungs “CityScape” demo-klip.

Der findes forskellige testskiver fra f.eks. DVE og Peter Finzel, der på nem vis kan hjælpe med at afsløre fejl i farver, bevægelse, de-interlacing eller andre specifikke områder. De bruges rutinemæssigt i forbindelse med tests.

Vi har naturligvis også vores eget test-program, som er udviklet til at give os et par af de features der kan være svære at finde på testskiver eller som bare er smarte lige at have hurtigt ved hånden. Det er især slør-testen vi her tænker på, da det kan være svært at vurdere dette på forskellige baggrunde uden selv at bestemme hvordan disse skal se ud. Du finder vores testværktøj monitorTest her.

Sådan læses graferne

Vi har de sidste 10 år brugt to typer grafer til at fremvise vores kalibreringer og farvepræcisionen på skærme i anmeldelser af tv-skærme. Fremadrettet vil vi kun bruge den ene metode fra den såkaldte HCFR-software.

Vi præsenterer altid følgende grafer i anmeldelser.

RGB (rød, grøn, blå)
De tre primærfarver - eller grundfarver - ved blanding af lys er rød, grøn og blå (forkortet RGB). De er også helt grundlæggende for en skærm, da den skaber alle de forskellige farver ved at blande rød, grøn og blå.

På grafen nedenfor ser du tre streger, der hver repræsenterer en grundfarve, sno sig omkring den stiplede linje for “100%”. Linjen repræsenterer de mørkeste farver mod venstre og løber mod de lysere farver mod højre. Jo tættere på “100%”, desto mere korrekt gengives farven. På en skærm opererer man med koordinater for farver og skærmen skal således gengive “korrekt”, når den bliver bedt om f.eks. at gengive en særlig nuance af grøn. Der er ikke grader af smag i gengivelse af farver på skærme for farver kan ikke defineres i et studie og derefter gengives korrekt hjemme i stuen uden at følge den korrekte metode. Det er derfor, der findes en standard for farver på skærme.

RGB-kurve


Der er to yderligere grafer herunder. Til venstre ses en skærm lige fra boksen med forkert farvegengivelse. Til højre ses en kalibreret skærm (samme som grafen ovenfor). Som du kan se til venstre, så er særligt den blå farve alt for kraftig og det giver et for blåligt og koldt billede (for høj farvetemperatur).

RGB-kurver før og efter kalibrering


Farvetemperatur
Som nævnt ovenfor, giver for meget blå i et billede et for blåt/koldt billede. Det er også det man kalder farvetemperatur. Alt lys kan beskrives med en farvetemperatur og i filmverdenen har man lagt sig fast på 6500 Kelvin som udgangspunktet for et mørkelagt lokale. I meget lyse omgivelser kan det være en fordel at have lidt højere farvetemperatur for at kompensere for omgivelsernes effekt på billedet, men vi kalibrerer mod samme 6500 Kelvin mål, som filmfolkene i studierne gør.

Ligesom før skal grafen sno sig så tæt på 100% fra venstre mod højre for at være korrekt. Igen ses de mørke toner til venstre og de lyse toner til højre.

Farvetemperatur-kurve


Gamma
I mange år har man defineret lyset i en skærm vha. en såkaldt gamma-funktion. Den definerer hvordan man omdanner digitale bits til lys i en skærm; fra de helt mørke toner til de lyse. Man er ved at redefinere gamma i forbindelse med HDR (high dynamic range), men det er et emne til en anden dag.

Gamma-grafen herunder skal læses ligesom de andre. Vi sigter efter en gamma på 2.2 fordi man gør det samme i produktionsstudierne. Gamma-grafen skal derfor sno sig omkring den hvide stiplede linje, der repræsenterer 2.2 gamma.

Gamma-kurve


Farverum (Rec.709, DCI-P3, Rec.2020)
Det menneskelige øje kan se et givet antal bølgelængder, som vi opfatter som synlige farver. Der findes flere ”farver” i omgivelserne omkring os - f.eks. infrarød - men dem kan det menneskelige øje ikke se. De synlige farver repræsenteres ofte i et diagram. Desværre kan moderne skærme ikke gengive tilnærmelsesvis alle de farver, som vi mennesker kan se. Man har i mange år brugt “Rec.709” farverummet (der i øvrigt er det samme som ”sRGB” på PC-skærme) og det kan ses som en trekant på grafen herunder.

På grafen skal du lægge mærke til flere ting. Den grå trekant er standarden for “Rec.709”-farverummet. Den hvide trekant er hvad skærmen gengiver. Skærmens hvide trekant skal hverken være større eller mindre end den grå reference-trekant. De små firkanter er check-punkter for udvalgte farver. De små cirkler er den farve, som skærmen gengiver. Cirklerne skal naturligvis helst ligge inde i de firkantede check-punkter for perfektion, men det kan være meget svært at opnå på skærme.

Rec.709 farverum


Til tider præsenterer vi også en graf for de såkaldte “DCI P3” eller “Rec.2020” farverum, som vi nævnte længere oppe. Disse farverum er langt større end det normale “Rec.709”, som stadig bruges i udbredt grad i dag. Igen gengiver den grå trekant selve farverummet (i dette tilfælde DCI-P3) og den hvide hvor meget skærmen kan gengive.

DCI farverum


Testmiljø

Når der testes sker det typisk over en længere periode og skærmene bliver udsat for omgivelser du også selv ville have derhjemme. Dvs. dagslys, skumring og totalt mørke vil blive blandet under testen så det kan vurderes hvordan skærmene performer i dagligdagen. Det er især med til at give et indtryk af hvordan reflektioner på skærmen opfører sig og hvorvidt skærmen er lysstærk nok til at kunne bruges i dagslys.

Testmetoderne er grundlæggende uændrede ift. de tidligere dage på FlatpanelsDK. Vi har som nævnt testværktøjer til at måle billedparametre såsom farvepræcision, gamma, kontrast (altid på ANSI-mønstre), sortniveau, lysstyrke, input lag og PWM (flimmer). Disse målinger præsenteres i testens tabeller og indgår naturligvis i vurderingen af skærmen. Vi er desuden begyndt at tage tidsmålinger af hhv. opstart på tv-skærmen og opstart af de vigtigste apps.

Vi tester også i helt almindelige scenarier såsom brug af tv-kanaler, streamingtjenester, spilkonsol, Blu-ray og PC. Vi benytter fortsat vores egetudviklede monitorTest til stresstest, men supplerer med andre testskiver.

Vi præsenterer, som altid, vores forslag til kalibrering af en given skærm i samtlige anmeldelser. Dette forslag er vejledende og vi kalibrerer mod et rum i aftentimerne. Det er vigtigt at understrege, at vi med en kalibrering sigter mod branchens standarder. Når en skærm får besked på at gengive Coca-Cola rød, så skal den gengive præcis denne farve. Producenten af skærmen skal ikke fortolke eller "forbedre", hvilket desværre er en udbredt misforståelse omkring billedgengivelse. Farver kan imidlertid påvirkes af omgivelsernes lysintensitet (rummets belysning), hvorfor vi understreger at vores kalibreringsforslag er beregnet til et relativt mørkt rum. Indstillingerne kan derfor være lidt anderledes, hvis du primært ser tv i en oplyst stue.

Vi har udviklet denne testmetode for snart et årti siden og den er lige så gyldig i dag som dengang, fordi den tager fat i de fundamentale elementer af billedgengivelse. Det betyder også, at alle skærme vurderes på lige vilkår. Det er det, vi mener en anmeldelse handler om!

God fornøjelse.



Del på: