Waarom de ene 10 nm-chip de andere niet is
TSMC, Samsung, Intel: iedereen maakt wilde claims over 10 nm- en 14 nm-bakprocessen voor CPU’s, zonder die te staven met een uniforme berekening. Wat Samsung onder 14 nm verstaat, is niet hetzelfde als de visie van TSMC of Global Foundries. Intel stelt zelf een uniforme meetmethode voor, die weinig verrassend nog anders is en vooral Intel-chips in een goed daglicht stelt. Waarom bestaat er zoveel discussie over wat in theorie een vrij eenvoudige maatstaf moet zijn?
Nanometers
22 nm, 14 nm, 10 nm… het zijn maten voor zogenaamde processornodes. De node is een indicatie van de dichtheid van de transistors op een microchip, die op zijn beurt het resultaat is van een steeds geavanceerder wordend bakproces. Iedere chipbakker heeft de ambitie om de individuele componenten van zijn microchip zo klein mogelijk te maken.
Kleinere transistors en interconnects zorgen voor een hogere dichtheid van logische schakelingen op een gegeven oppervlakte, wat in theorie voor krachtigere CPU’s zorgt. Bovendien laden en ontladen kleinere transistors sneller dan hun grotere broertjes. Dat heeft een rechtstreekse impact op de snelheid en de efficiëntie van de chip. Kleiner is doorgaans beter, sneller, efficiënter en zuiniger.
De benaming van een node, uitgedrukt in nanometer, heeft in tegenstelling tot wat vaak gedacht wordt geen betrekking op het formaat van een transistor. Vandaag is het eigenlijk moeilijk te zeggen waar de nanometers precies voor staan. Iedere chipbakker lijkt zelf te kiezen wanneer hij of zij overstapt van een oude node naar een nieuwe. Veelal gebeurt die overstap wanneer het gros van het fabricageproces vernieuwd is, en een significant deel van de componenten op een chip kleiner is.
Laagjes en bouwstenen
Je zou de nanometer-indicatie nog het best kunnen omschrijven als de resolutie van de bouwstenen waaruit een chip wordt opgebouwd.
[related_article id=”210350″]Een transistor bestaat uit een poort, een bron en een afvoer, en die componenten moeten zelf door een chemisch proces op heel nauwkeurige schaal uit de juiste materialen worden opgebouwd. Dat gebeurt door een wafer waarop een chip gemaakt wordt helemaal te bedekken in een laag bouwstof, waarna licht door een masker schijnt met daarop een schemastructuur.
Enkel delen van de chemische laag die bestraald werden, blijven aanwezig op de chip terwijl de rest wordt weggespoeld (of omgekeerd). De resolutie van het licht doorheen dat masker geeft een indicatie van het formaat van de processornode. Die zogenaamde lithografie is slechts één van de vele stappen in het bakproces van een CPU, en allemaal hebben ze een impact op de kwaliteit en de densiteit van de uiteindelijke chip. Niet iedere stap is even fijn en de verschillen zijn niet uniform over de verschillende chipbakkers heen.
Koppelen we met die kennis terug naar Intel, dan kunnen we begrijpen waarom de chipkoning niet zo blij is met de concurrentie. Intel claimt dat wat Samsung en TSMC 10 nm noemen, nauwer aansluit bij het 14 nm-proces dat team Blauw drie jaar geleden al introduceerde. Bovendien lijkt het dat Intel achterloopt in de introductie van zijn eigen 10 nm-node, terwijl die bij lancering een veel hogere densiteit zal hebben dan wat de concurrentie kan afleveren.
Eengemaakte definitie
Intel stelt daarom voor om een oud systeem voor het toewijzen van processornodes opnieuw op de proppen te halen. Volgens de fabrikant moet het eigenlijke formaat van de componenten, gecombineerd met de feitelijke dichtheid, aanleiding geven tot de benaming van een node, in contrast met het nattevingerwerk van vandaag.
Daarom komt Intel met een concreet voorstel. Het wil de densiteit van een chip uitdrukken in aantal transistors per vierkante millimeter. Daarbij zou je het totale aantal transistors kunnen delen door de oppervlakte van de chip, maar dat geeft een vertekend beeld. In de praktijk hebben zaken als architectuur en cache een grote invloed op de hoeveelheid transistors op de totale oppervlakte van de ‘die’, waardoor die formule een vertekend beeld zou geven over de werkelijke dichtheid waarin een node kan voorzien.
Als oplossing wil Intel de dichtheid van een node baseren op de werkelijke dichtheid van twee specifieke en veelvoorkomende logische combinaties. Op een chip vormen de transistors samen met de interconnects schakelingen die de CPU zijn intelligentie geven. Een veelvoorkomende schakeling is een 2-Input NAND-cel, die uit vier transistors bestaat. Een zogenaamde Scan Flip Flop-cell is aanzienlijk complexer, maar eveneens vaak gebruikt. Door in de twee gevallen het totale aantal transistors per cel te delen door de oppervlakte van de gegeven cel, krijg je een accurate dichtheid voor die cel die onafhankelijk is van specifieke architectuurkeuzes. Intel wil beide resultaten combineren tot één gewogen geheel, waarbij de dichtheid van de NAND2-cel voor 60 procent meetelt, en die van de Scan Flip Flop voor 40 procent.
[related_article id=”212797″]Het resultaat is een objectief aantal transistors per vierkante millimeter dat in theorie geen enkele fabrikant of architectuur bevoordeeld. In de praktijk heeft Intel de meest geavanceerde fabrieken, en geeft de formule aantrekkelijkere resultaten voor team Blauw. Hoewel dat misschien eerlijk is, kan je er gif op innemen dat de concurrentie niet staat te trappelen om de kwaliteit van hun nodes op Intels manier aan te duiden. Samsung, TSMC en hun klanten zoals Qualcomm gebruiken het ‘10 nm’-praatje immers als marketingvoer om respectievelijk hun fabrieken en hun hardware aantrekkelijk te maken voor klanten.
Strijd op dichtheid
Het systeem zou de vage nanometerbenaming niet hoeven te vervangen, maar wel een duidelijke indicatie geven over de werkelijke kwaliteit van het productieproces die achter een bepaalde node bij een fabrikant schuilt.
Intel illustreert dat met de 14 nm-node in een vergelijking waar zijn chips weinig verrassend het beste uitkomen. Kijkt het naar zijn 14 nm-chips, dan telt het 37,5 miljoen transistors per vierkante millimeter. De concurrentie past ‘slechts’ 30,5 miljoen transistors op dezelfde oppervlakte. Bovendien zijn de individuele poorten en interconnects bij Intel iets kleiner dan bij pakweg TSMC of Samsung.
Het bovenstaande illustreert meteen waarom Intel het ziet zitten om erg straffe claims te maken over zijn eigen 10 nm-proces. Dat moet de transistordichtheid in vergelijking met de 14 nm-line-up met maar liefst 2,7 keer vergroten. Een dergelijke winst komt niet alleen voort uit het schalen van de node, maar ook uit de introductie van nieuwe technologieën. Zo implementeert Intel ‘single dummy gates’. Normaal gezien wordt iedere logische cel op de chip geïsoleerd van zijn buren door een paar inactieve poorten. Door de hoeveelheid nodige dummy-gates te halveren, komt er heel wat extra plaats vrij op de chip.
Als tweede innovatie maakt de ‘contact-over-active-gate’-technologie zijn intrede. Daarmee doelt Intel op het contactpunt tussen de transistors en de metalen interconnects. Die interconnects verbinden transistors en cellen met elkaar, en zorgen zo voor de interne logische capaciteiten van de chip. Tot vandaag zaten de aansluitingspuntjes tussen interconnect en transistor lichtjes geschrankt. Intel slaagt er met zijn 10 nm-node in om de contactpuntjes meteen onder de transistorgates te plaatsen, wat opnieuw heel wat plaats vrij maakt.
Om de densiteit in perspectief te zetten: de stap van 22 nm naar 14 nm was goed voor een verhoging van de densiteit met factor 2,5.
Relevant?
De vraag werpt zich op of het hele node-gedoe überhaupt nog zo belangrijk is. Vroeger was een procesverkleining bijna recht evenredig met een tastbare prestatiewinst in de vorm van een hogere klokfrequentie. Vandaag is de frequentiewinst per node-generatie minimaal.
Kijk ter illustratie naar de Intel Core i7-4790K ‘Devil’s Canyon’. Dat is de krachtigste chip op het klassieke 22 nm Haswell-platform (Haswell-E buiten beschouwing gelaten). Met een Thermal Design Point (TDP) van 88 watt voorziet Intel een basisklokfrequentie van 4 GHz met een boost tot 4,4 GHz. De spirituele opvolger van Devil’s Canyon is de Core i7-6700K. Die 14 nm-Skylake presteert op benchmarktests (net) beter dan zijn voorganger, maar het TDP is met 91 watt zelfs iets hoger, terwijl de turbofrequentie met fabrieksinstellingen op 4,2 GHz blijft steken. De standaardfrequentie van beide chips is identiek, net als hun initiële adviesprijs.
Vergelijk dat met de sprong van 32 nm-Sandy Bridge naar 22 nm-Haswell. Ook toen stagneerde kloksnelheid stilaan, al was frequentiewinst een stuk tastbaarder. De Core i7-2700K haalde een standaardfrequentie van 3,5 GHz met een boostsnelheid van 3,9 GHz op een TDP van 95 watt. De huidige verbeteringen komen meer van architectuur dan van nodeverkleining, terwijl de focus al enige tijd op de verbetering van de efficiëntie ligt, en niet op de absolute verhoging van kloksnelheid.
Resultaten, geen grafiekjes
Intel lijkt met zijn voorstel over een eerlijk meetproces voor transistordichtheid een beetje naast de kwestie te argumenteren. 10 nm klinkt goed en een beter proces leent zich tot knappe grafieken, maar technologie terzijde moet Intel uitpakken met een winst die tastbaar is voor iedereen. Dat kan door de klokfrequentie naar boven te halen (onwaarschijnlijk) of de prijs naar omlaag te halen.
[related_article id=”216748″]Het zal de consument een worst wezen dat TSMC’s 14 nm-proces iets slechter is als dat van Intel, als de AMD-chips die uit de fabriek rollen minder dan de helft kosten dan de Intel-equivalenten. AMD houdt zich weinig verrassend minder bezig met kloksnelheid. Verder dan “We kijken samen met TSMC naar de toekomst en zullen afstappen van 14 mm wanneer dat een voordeel biedt”, komt AMD niet. Logisch, aangezien de chipdesigner weinig te zeggen heeft over de evolutie van de nodes.
Voor Samsung en Qualcomm is de vergelijking tussen nodes en CPU’s in de praktijk helemaal irrelevant, aangezien een ARM-chip toch nooit rechtstreeks tegenover een Intel-CPU zal staan.