A
Messiás
Minden bizonnyal sokan várják már az idén júniusra ígért új high-end PC processzort, a K7-et. Ha az AMD által meghirdetett teljesítményt az új proci hozni tudja, akkor ez alapjaiban fogja megrengetni az Intelt, és a Pentium III eladási statisztikák meredek zuhanásához vezethet... Az Intel egyetlen reménysugarát az AMD szokásos gyártástechnológia fejlesztési (0.25 mikron -> 0.18 mikron) nehézségei jelenthetik, mely annak idején a K6 szállítások elmaradását okozta (akkoriban épp a 0.35 -> 0.25 átállással voltak zűrök). Ebben a kis fejtegetésben összefoglalom az eddig K7-ről megjelent információkat, több aspektusból is vizsgálva az AMD helyzetét és kilátásait a K7-re vonatkozóan. Szó lesz a K7 belső felépítéséről, az alája készülő alaplapokról, az EV6 buszról és annak rejtelmeiről, stb... Adathalom Lássuk mi is az, amitől az egyszeri hardcore PC-s megnyalja mind a tíz ujját :) Ha ebből a rumliból minden elsőre leesett, akkor gratulálok! :) Kezdjük tehát az elején! Az EV6 busz licenszelése az AMD egyik kulcsfontosságú döntése a K7 architektúrájával kapcsolatban. Az EV6 ún. Point-to-Point buszrendszer, vagyis a buszon elhelyezkedő dolgok - processzorok, memória, híd más buszokhoz - a chipkészlettel külön-külön tudnak kommunikálni. Ez nem csak gyorsítja a busz működését, hanem lehetővé teszi különböző sebességű kommunikációs csatornák definiálását (erről később még szó lesz). Az EV6 buszt eredetileg többprocesszoros, nagysebességű rendszerekhez készítették, így nem meglepő, hogy az AMD terveiben szerepel egy ultra-szerver koncepciója is, mely akár 8 db 1 GHz-es K7-ből is állhat! Ha minden jól megy, ez akár már 2000 végére kézzelfogható valósággá is válhat, ugyanis egy Poseidon nevű cég bejelentette, hogy a jövőben az AMD-vel karöltve 8 db K7 fogadására képes alaplapot kíván fejleszteni. Érdemes belegondolni, hogy egy ilyen megoldás az Intel GTL+ buszrendszerével azt eredményezné, hogy a 100 MHz-es, chipkészletet és a processzorbuszt összekötő sávszélességen 8 proci osztozna! A GTL+ egyszerűen képtelen lenne kiszolgálni ezt a brutális teljesítményű rendszert. Az EV6 azonban minden processzornak dedikált csatornát biztosít, így a K7 esetén mind a 8 proci külön-külön 200 MHz-es sávszélességet kap! (nem beszélve arról, hogy ez a sebesség bármikor megnövelhető akár 400 MHz-ig is!) Emellett az EV6 buszt használó Alpha chipkészletek képesek nem csak 64, hanem akár 256 bites szélességben is kommunikálni a memóriával - hiszen kettőnél több processzor esetén erre feltétlenül szükség van az optimális teljesítmény biztosításához. Ilyen 'robosztus' teljesítményt várhatunk majd a Poseidon-AMD együttműködés eredményeként is... A buszsebességnek egy külön témakört szentelek (melyben kiderül, miért is 'zártam' idézőjelek közé). Lássuk, hogy kerül ide a 'multimédia' kifejezés. Az K7-ben az FPU szerepét egy olyan egység vette át, mely nem csak a tradicionális lebegőpontos utasításokért (pl. FADD, FMUL, FST) felelős, hanem feladatkörébe tartozik az MMX és 3DNow! utasítások végrehajtása is. 3 párhuzamos végrehajtó egység dolgozik együtt, ezek együttes elméleti teljesítménye azonos órajelen csaknem duplája a Pentium III lebegőpontos egységének... A K7 multimédia egysége végre teljesen pipeline-ozott ('fully pipelined multimedia unit'), ezzel az AMD régi adósságát törleszti. A pipeline-os FPU hiánya okozta ugyanis a K6 széria Pentium II-höz viszonyított bőséges lemaradását a lebegőpontos számolást igénylő alkalmazásokban (3D Studio, játékok, stb). Ezen az AMD a K6-2-vel úgy próbált segíteni, hogy egyrészt az MMX egységet felturbózta (mai napig a leggyorsabb MMX végrehajtó egység a K6-2/K6-III-ban van), másrészt pedig bevezette a lebegőpontos utasítások párhuzamosítását célzó új utasításkészletet, a 3DNow!-t. A K7 esetén azonban már az AMD nem alkuszik: Pentium III-at verő multimédia teljesítményt ígér már 3DNow! nélkül is... (valamint tervezik a 3DNow! kiegészítését újabb utasításokkal) A K7 a P6-ra (P6 alatt értek minden 6. generációs Intel processzort: Pentium Pro, Pentium II, Pentium III, Celeron, Xeon) épülő Intel procikhoz hasonlóan az utasításokat a sorrendjüktől függetlenül tudja végrehajtani - feltéve, hogy nincs ütközés közöttük. Ezt nevezi a szakma 'Out Of Order Execution'-nek. Ehhez hozzájön még a 'speculative' jelző, mely az elágazások irányának becslését takarja (a P6 architektúráról, az ütközésekről és az elágazásbecslésről bővebben itt olvashatsz). Az elágazások nagy hatékonyságú becsléséhez szükség van egy nagyméretű, 2048 bejegyzéses Branch Prediction Table-re, melynek segítségével a K7 minden bizonnyal a P6-nál jóval nagyobb eséllyel fog indulni a 'jósversenyen' - hiszen a P6-nak mindössze 512 bejegyzéses táblája van... Az szubrutinokból való gyorsabb visszatérést segíti a Return Stack. A kilencszeresen szuperskalár felépítés jól látható az AMD által kiadott hivatalos K7 blokk diagramon. Ezen a nem-multimédia utasításokat végrehajtó egységet 3 db 'IEU-AGU' feliratú dobozka, míg a multimédia egységet a 'FStore', 'FADD - MMX - 3DNow!' és az 'FMUL - MMX - 3DNow!' dobozkák jelzik... Cache A K7 minden eddigi processzorénál ('processzor' alatt mindig a 80x86 családba tartozó processzorokat értem) jóval nagyobb, összesen 128 KB L1 cache-t kapott. Ez duplája a K6-énak és négyszerese a Pentium III-énak! Gondoljunk csak bele, ez majdnem annyi, mint a cache-es Celeronok (Mendocino) össz cache mérete! Az AMD ezzel az egyedülállóan nagy L1 cache-sel az L2 cache lassúságát próbálja ellensúlyozni, ugyanis az első K7 széria 512 KB L2 cache-t fog tartalmazni, mely a processzor órajelének mindössze 1/3-ával fog ketyegni... Ez első nekifutásra elegendő is lesz, azonban a proci órajelének növelésével szükség lesz egy gyorsabb, nagyobb L2 cache-re is. Az AMD úgy tűnik, felkészült mindenre, a K7 L2 cache-e ugyanis skálázható sebességű: 1/4-e,1/3-a, 1/2-e, 2/3-a lehet a proci órajelének, vagy akár meg is egyezhet azzal. Az AMD valószínűleg azért pont 1/3-os sebességet választott az első K7 sorozatnak, mert így 600 MHz-ig alkalmazhatják a Pentium II-400-nál is használt 200 MHz-es SRAM-okat, melyek jóval olcsóbbak, mint a 250 és 300 MHz-es társaik. Az már most is egyértelmű, hogy az AMD a K7-tel nem csak a szerver és professzionális munkaállomás piacot célozza, hanem a lassabb, kisebb L2 cache-es verziókkal elhódíthatja a középkategória piacát is a Pentium III-tól... A szerveripar felső rétegeit pedig egy még nagyobb dobással is megörvendezheti az AMD, ugyanis a K7 rugalmas L2 cache kezelése lehetővé teszi akár DDR (Double Data Rate, köv. fejezetben lesz róla szó) SRAM-ok alkalmazását is, mellyel az L2 cache sebessége akár többszöröse is lehet a processzor órajelének! Arról egyelőre nincs szó, hogy a jövőbeni K7 alaplapokra integrálnak-e vajon L3 cache-t. Az AMD referencia alaplapjairól (kódnevük Gomez és Femster - ez utóbbi csak találgatás) készült gyenge minőségű fotókon nem látszik semmilyen L3 cache-re utaló jel. Ez azonban nem zárja ki az L3 cache alkalmazásának lehetőségét, hiszen az L3 cache az EV6-ra épülő Alpha rendszerekben mindennapos, és az AMD a K6-III-nál is alkalmazza ezt a megoldást... Buszsebesség Bármily meglepő is, a K7 esetében nem beszélhetünk egyértelmű, jól meghatározott buszsebességről. A hivatalosan bejelentett 200 MHz-es 'buszsebesség' valójában csak a processzor és az alaplapi chipkészlet közötti kommunikáció sebessége. A chipkészlet és a memória, ill. a chipkészlet és a többi busz közötti adatforgalom egymástól függetlenül, különböző órajeleken folyhat! Így nem szabad hinni olyan rosszindulatú pletykáknak, hogy a PC133 SDRAM technológia általánossá válásával és a Rambus DRAM késésével az AMD a 200 MHz-et lecsökkenti 133-ra. Szó sincs erről, a chipkészlet és a processzor közötti csatorna kezdésnek 200 MHz lesz, a chipkészlet és a memória közötti forgalom pedig egyelőre meghatározatlan, legalább 100 MHz-es sebességű lesz. Elképzelhető az is, hogy különböző árfekvésű alaplapok különböző memória-sebességet fognak kínálni, így lesz PC100-as és PC133-as, esetleg a DDR (Double Data Rate) SDRAM vagy az interleave trükk alkalmazásával valódi 200 MHz-es memória-sebességű alaplap is (természetesen a később bevezetésre kerülő Rambus DRAM-okra is épülni fog alaplap, de az még jóval odébb van). Nézzük csak, mik is ezek a furcsaságok? DDR SDRAM? Ez a 'sima' SDRAM duplasebességű verziója, mely egy órajelciklus alatt 2 adat mozgatását teszi lehetővé, így effektíve - kívülről szemlélve - duplaakkora órajellel működtethető. Azonban a speciális megoldásoknak köszönhetően a DDR SDRAM ára jelenleg igencsak borsos :( Az interleave megoldás is hasonló célt szolgál: a memóriabankokat kétfelé osztva, egy lépésben két adatot mozgathatunk (egyik megy az egyik bankba, másik megy a másik bankba), ezzel megduplázható a memória sebessége. Ennek egyszerűbb megoldásához azonban lehetséges, hogy csak páros számű memóriabank felelne meg, vagyis már az SDRAM-okat is párosával kellene az alaplapba tenni (mint annak idején a Pentiumoknál). Bármilyen megoldást is alkalmaznak az alaplapgyártók, nagy valószínűséggel a most használt PC100-as memóriák 'foglalatra találnak' a jövő K7 alaplapjain... Alaplap Sajnálatos módon mind a mai napig nem került nyilvánosságra a K7 referencia alaplap specifikációja, így a fejlesztés csakis az AMD-vel szoros együttműködésben történhet. A VIA és az ALi bejelentette, hogy az AMD-vel karöltve már dolgoznak a K7-et kiszolgáló chipkészleteiken, egyelőre azonban úgy tűnik, hogy még tesztelési fázisban sincsenek ezek az új chipkészletek. A K7 tervezett megjelenési dátuma ('99. június) vészesen közeledik, így az AMD leszögezte, hogy a referencia alaplapjaikon (Gomez, Femster) található saját chipkészletük tömeggyártásra kész, és ha a VIA és az ALi nem tudják időben befejezni a munkálatokat, akkor az alaplapgyártóknak az AMD saját maga fogja gyártani a chipkészletet. Ez azonban nem vethető össze az Intel piacpolitikájával, ugyanis az AMD azt is kijelentette, hogy nem szándékozik chipkészletet gyártani, ez csupán akkor fordulhat elő, ha a partnercégek (VIA, ALi) nem tudják időben szállítani az alaplapgyártóknak a saját terméküket... Tehát úgy tűnik, az AMD bebiztosította magát - már ami az alaplapot illeti. Mi, vagyis az egyszeri felhasználók viszont még mindig nem tudjuk, vajon mire is lesznek képesek a K7 alaplapok. Támogatni fogják-e a legújabb technológiákat: az Ultra DMA/66-ot, a 4x AGP-t, a PC133-as SDRAM-okat? Ezek a feltételek elsősorban a chipkészleten múlnak, mely az AMD-nél már készen áll - egyelőre azonban hírzárlat van vele kapcsolatban :( Várnunk kell a hivatalos bejelentésekre... Felmerülhet egy fogós kérdés a K7-tel kapcsolatban: az addig rendben is volna, hogy az AMD licenszeli az EV6 buszt a Compaqtól, de vajon miért nem az Alpháknál (és a Pentium/K6-nál is) jól megszokott fekvő foglalatos (socket) kialakítást választotta a processzor elhelyezésére? A válasz könnyen kiokoskodható, ha figyelembe vesszük azt az tényt is, hogy a K7 SlotA kialakítása fizikailag megegyezik a Slot1-gyel - vagyis csak elektronikai felépítésben különböznek! Nos, íme a megoldás: az AMD ezzel is az alaplapgyártók munkáját próbálja könnyíteni, hiszen így az eddigi Slot1-es alaplapok megtarthatják elrendezésüket, csupán a belső (elektronikai) kialakításukat kell módosítani. Nem szabad tehát csodálkozni, ha az ősszel megjelenő új 'Abit XX7'-es alaplap külsőre meg fog egyezni a mostani BX6 v2-esekkel :) Problémák Talán nem haszontalan pár szót ejteni az AMD nehézségeiről, melyek romba dönthetik a K7 csodaországot :( A legnyilvánvalóbb problémát az AMD gyártókapacitása jelenti. A jelenlegi tervek szerint az USA-beli Austinban található 'Fab 25' nevű gyárban kezdődik a K7 sorozatgyártása, de itt csak az első, 0.25 mikronos K7-eket fogják gyártani. A 0.18 mikronra való átállással kapcsolatos kutatások és fejlesztések már az év elején megkezdődtek, kézzelfogható eredményt azonban az ősz vége előtt nem nagyon várhatunk. November 1-jén indul be az AMD új, drezdai processzorgyára, a 'Fab 30', mely csak és kizárólag K7-et fog gyártani, remélhetőleg már a 0.18 mikronos verziót. Bízzunk benne, hogy az AMD ezúttal időben le tudja küzdeni a gyártás nehézségeit, és nem válik mindjárt a megjelenéskor hiánycikké a K7. Bízzunk abban is, hogy a 'mikronváltás' idejében sikerülni fog, és nem térnek vissza az 'agyonórajelezett-forrófejű' K6-233-ashoz hasonló idők... Ismét felmerülhet egy kérdés: miért olyan fontos a K7-tel mindjárt az elején lemenni 0.18 mikronra? Miért nem jó a 0.25, legalább egy ideig? Egyszerű a magyarázat: a K7 processzormag óriási mérete - 184 négyzetmm - rendkívül drágáva teszi a gyártását, hiszen így egységnyi szilíciumból jóval kevesebb processzor gyártható le! (vegyük hozzá a nagyobb méret miatti magasabb selejtarányt is) 100 db K7-re való szilíciumból több, mint 220 db K6-2 gyártható! (K6-2 mag: 81 négyzetmm) Látható tehát, hogy a kezdeti időkben előjön egy újabb probléma: a K7 ára az AMD eddigi árstratégiájába nem fog passzolni, a K7 minden bizonnyal a Pentium III-nál legalább 20-30%-kal drágább lesz :( A jövő Foglaljuk össze, mit tervez az AMD az elkövetkezendő másfel évre: Utóhang Az AMD mindezidáig az Intel után loholt, próbálta utolérni először MHz-ben, majd technológiában. A K6-2 meghozta az AMD számára a szakma elismerését és a vásárlók bizalmát. Ma a tökéletes összhangot már csak az akadozó szállítások zavarják meg... Hamarosan
megérkezik a K7, mellyel az AMD ezúttal magasra teszi
a mércét, s üldözőből
üldözötté válik. Vajon mit
válaszol az Intel a K7-re? Először is ott van a
tarsolyában a Pentium III 0.18 mikronos változata,
Coppermine kódnév alatt, mely a
K7-et követve már ősszel a boltok polcain lehet, 600 MHz-es tervezett induló
órajelen. Ezzel azonban a K7 'háborús gépezetét' nem tudja az Intel megállítani,
ehhez valami nagyobb durranás szükséges. Idejében elkészül a P7 (kódneve
Willamette), hogy fölébe kerekedhessen a K7-nek? Képes lesz-e a P7 a P6
architektúra képességeinek duplázására? Lássunk egy táblázatot arról, hogy
is kellene kinéznie a P7-nek, hogy versenyképes termék legyen:
A legnagyobb dilemmát a jobb alsó sarokban lévő kérdőjel jelenti. A P7 meghirdetett hatalmas cache méretei arra engednek következtetni, hogy legalább 9-10 szuperskalár pipeline-t fog működtetni. A Coppermine - amint látható - nem ellenfele a K7-nek, hiszen még mindig a jó öreg P6 architektúrára épül, így csak az órajellel és az L1 cache növelésével tudja az Intel eladható termékké varázsolni :) A végére maradt (a sok találgatás után) egy friss, 100%-os info: 1999-ben és 2000-ben sem fogunk unatkozni! Cikkzárta után ... ... érkezett a hír, miszerint:
1999 |