Několik generací Intel Atomu předčasně umírá – které a proč? | Kapitola 2
Seznam kapitol
Minulý týden se přišlo na to, že kauza předčasně umírajících serverových Atomů C2000 představuje jen pověstnou špičku ledovce problémů a že rozsah potíží je mnohem větší, než se původně myslelo. Pojďme se podívat, jak se věci mají ve skutečnosti a proč může být postižen skoro každý z vás.
Problémy narůstají – už ne jeden produkt, ale celá architektura
Když jsem minulý týden obdržel do emailu jeden z mnoha změnových dokumentů Intelu Product Change Notification (PCN), konkrétně ten s číslem 116196-00, nestačil jsem se po jeho otevření divit. Stálo v něm, že Intel uvádí pro (v té době již celkem staré) Atomy E3800 (kódové označení Bay Trail – I) určené pro průmyslová zařízení a automotive nový stepping D1, aby zamezil degradaci integrovaných obvodů.
Konkrétně jde o obvody sběrnic Low pin count (LPC), USB2.0 Low speed (LS) / Full speed (FS) a Secure Digital (SD) karty. Zase LPC sběrnice? Hledal jsem v příslušném Specification Update a co nevidím - chyba VLI89 z července 2017:
Podle dokumentace může LPC sběrnice v případě, že se používá několik let, přestat fungovat. To stejné k USB a SD Card. Déjà vu? Tentokrát nikoli Avoton, ale Atom E3800 Bay Trail – I ?
Nedalo mi to a porovnal jsem různé jiné chyby uvedené v dokumentaci s chybami v „klasických“ procesorech Bay Trail, tj. Pentiích a Celeronech. Chyby se více méně shodovaly, jedná se přece o podobný design. Procesory Bay Trail – I a Bay Trail mají dokonce stejné CPUID, konkrétně:
Stepping | CPUID | Použití |
A0 | 30671h | předprodukční |
B0 | 30672h | předprodukční |
B2 | 30673h | Celeron, Pentium |
B3 | 30673h | Atom E3800, Celeron, Pentium |
C0 | 30674h | Celeron, Pentium |
D0 | 30679h | Atom E3800 |
D1 | 30679h | Atom E3800 |
Chyba degradující LPC sběrnice u Celeronů a Pentií však v dokumentaci uvedena není. Proč? Jednoduše proto, že Intel, patrně aby omezil veřejnou publicitu, vytvořil speciální dokumentaci Specification Update nazvanou „Intel® Celeron® Processor J1900, N2807 & N2930 for Internet of Things Platforms Specification Update Addendum“, ve které je uvedena jediná chyba, a to konkrétně VLP1 s degradující LPC sběrnicí.
Problémy tedy netrpí pouze Atom C2000 Avoton, ale celá generace procesorů architektury Silvermont, tj. také všechny procesory Bay Trail. Jen Intel se prostě domnívá, že u běžných consumer procesorů Celeron a Pentium se problém v rozumném časovém horizontu neprojeví, že by se mohl projevit pouze v případě, kdy jsou procesory provozovány non-stop. Proto oprava serverových Atomů C2000, proto se týká průmyslových Atomů E3800, proto je uvedena pro Celerony nasazované v IoT řešeních, ale proto zároveň není přiznána pro běžné consumer použití.
Můžeme si ovšem klást otázku, co znamená ono „may stop functioning in the outer years of use“. Osobně se domnívám, že ony „outer years“ jsou z pohledu Intelu vázány k délce záruční doby. Typicky tedy tři roky. V případě Atomů C2000 Intel nijak neodškodnil ty uživatele, kteří základní desky s těmito čipy zakoupili mezi prvními již na konci roku 2013 a byli postiženi v době po uplynutí záruční doby. Intel k celé situaci přistoupil tak, že odškodňoval svoje odběratele jako Cisco, ale neprovedl stažení čipů z trhu. Někteří zákazníci tak doplatili na to, že se chyba v jejich případě projevila až později. Celkové náklady na stažení a výměnu čipů by totiž byly i jen pro Atom C2000 obrovské, samotné Cisco celá kauza stála 125 milionů dolarů a to prováděli pouze opravu na základní desce, nikoli výměnu procesorů. Výměna procesorů je v tomto případě složitá v tom, že se jedná o čipy v balení BGA (Ball Grid Array), tedy přiletované k základní desce. Jejich odletování a přiletování opravené verze není triviální operací, a tedy jde o drahou akci.
Pokud bychom aplikovali statistiku zjištěnou z Atomů C2000, pak při nonstop provozu budou i consumer Celerony a Pentia umírat v době od 18 měsíců provozu se zvýšeným rizikem po třech letech. V případě použití osm hodin denně půjde o dobu od čtyř a půl roku se zvýšeným rizikem po devíti letech.