Denne oppstarten vil drepe CPU og GPU på en gang
NyheterFor over en måned siden annonserte Tachyum, en liten teknologisk oppstart, en ny prosessorfamilie, Prodigy, som den kaller verdens første universelle prosessorplattform. Utover den nye etiketten er det imidlertid en rekke vanskelige krav som selskapet har lagt fram, inkludert det faktum at det gir en 10x ytelsesforbedring på konvensjonelle prosessorer.
Vi tok opp med Tachyums administrerende direktør Dr. Radoslav 'Rado' Danilak via e-post, for å finne ut mer om venture og hvor nøyaktig kommer disse tilsynelatende outlandish påstandene fra.
- Tachyum-prosessorer er bestemt for datasentre. Sjekk ut vår liste over de beste web hosting selskapene på markedet.
1. Hvordan er det forskjellig fra Heterogene System Architecture (HSA) Foundation?
Tachyums Prodigy-prosessor er en ny og nyskapende prosessorarkitektur, utviklet ved hjelp av maskinvare- og programvarekodesign fra dag 1. Den har en enkelt programmeringsmodell, en enkelt instruksjonsstrøm, fullt sammenhengende minne og fullstendig sammenhengende inter-core-kommunikasjon. Vi har også lagt til data parallellisering til vår prosessor programmeringsmodell for å bedre adressere visse AI applikasjoner.
2. Din pressemelding nevner en AI-chip, GPU og CPU som en del av den familien. Kan du fortelle oss mer?
Tachyums Prodigy-prosessor er en enkelt enhetlig arkitektur, som viser utelukkende rekkefølge, med prosessorhardware (les: transistor teller / kjernestørrelse) som ligner på enkle, i-bestilling-utførelsesmaskiner. Vi har oppnådd dette ved å laste ned til vår kompilator, oppgaver tradisjonelt implementert i CPU-maskinvare. Den resulterende IPC, klokkehastigheten og effektreduksjonsforbedringene gir ikke bare et overbevisende verdioppslag i vårt kjernemarked, Hyperscale Data Centers, men de gjør det også mulig for Tachyums Prodigy-prosessor å overskride NVIDIA Volta-ytelsen på Neural Nets.
Tachyum har skapt en ny prosessorarkitektur som ikke bare overgår konkurransen i datasenterets arbeidsbelastninger, men overgår også konkurransen i alle AI-disipliner. Prodigy demonstrerer en størrelsesorden bedre ytelse på Symbolic AI, Bio AI og General AI (på grunn av deres kontrollintensive natur) enn eksisterende AI-sentriske chips. Tachyum har IKKE kombinert en CPU, GPU og AI-chip.
Tachyum har utviklet en nyskapende prosessorarkitektur som tilbyr en forstyrrende verdi proposisjon på tvers av flere applikasjonsdomener. Vi har også inkludert i Prodigy-arkitekturen visse arkitektoniske forbedringer for å forbedre ytelsen på AI-arbeidsbelastninger, for eksempel komprimerte 8-biters flytende punktkoeffisienter og matrise-multipliseringsoperasjoner.
3. Din bedrift er lovende å holdbart forstyrre beregningsmarkedet med noen, ærlig ekstraordinære krav. Hvordan oppnådde du så mye ved å bruke (relativt sett) så lite i FoU i forhold til Samsung, Nvidia eller Intel.
Prodigy-arkitekturen er resultatet av flere tiår med erfaring som jeg utviklet for å utvikle prosessorer (for eksempel Playstation 2, Tesla), flashminnekontrollere (Sandforce) og flashbaserte systemer (Skyera). Flere år med selvfinansiert FoU gikk foran Tachyums fremkomst fra stealth-modus. Jeg har alltid vært interessert i å løse “enhet fysikk” utfordringer, for eksempel pålitelighetsproblemer i dual level celle flash-minne, som jeg gjorde på Sandforce. Prodigy er et annet eksempel på det. Med tiårets lange stagnasjon av prosessorens klokkehastighet, som i stor grad skyldes langsomme ledninger i forhold til transistorens omdreiningshastighet, og kombinert med CPU-arkitekturer som ble designet når ledningene var uendelig raske i forhold til transistorer, et nytt blikk på en optimal prosessarkitektur fra det 21. århundre var berettiget. Vi startet fra et rent papirark med en designfilosofi om å redusere antall sakte ledninger på en brikke, og redusere gjennomsnittlig lengde på eksisterende ledninger. Resultatet er gjennombruddsytelse og lavt strømforbruk.
4. Hvorfor kan Tachyum lykkes der større organisasjoner har mislyktes?
Jeg må si at det er på grunn av mine tekniske instinkter født av hardt vant erfaring, sammen med å lære av andres feil og disiplisere meg selv til å jobbe bare på viktige utfordringer. Selv i store selskaper som Intel og NVIDIA, springer den virkelige innovasjonen vanligvis fra en liten gruppe innovatører. På SandForce som jeg grunnla, var konkurrentene mine Intel, Samsung, Toshiba, Sandisk, Micron, Western Digital, LSI, Seagate, og mange andre med 1000s av ingeniører, og med mindre enn 100 ansatte vant vi.
Å ha instinkt til å gå i riktig retning er viktig, ansette beste lag, lære av feil av konkurrenter, og jobbe bare på viktige ting. Et eksempel er Intel Itanium som mislyktes på kompilatorer, så vi utviklet kompilatorer først og bygger arkitektur rundt kompilatorer. Selv ved nVidia ble nøkkelinnovasjon gjort med et par [av] grupper med ti ingeniører, ikke tusenvis. Hvis du har et team av “guder”, [head] count er ikke så kritisk og kan fylles med entreprenører.
5. Du sier at å bygge en kandidat til menneskelig hjerneprosjekt vil ta mindre enn tre år med om lag 250 000 chips, er det trygt å anta at denne prosessoren har en topp ytelse på 4 teraflops?
Tachyums 64-kjerne Prodigy-prosessor, genererer ~ 128TFLOPS. Vi hevder at systemintegratorer i 2020, med volumproduksjon av Prodigy, vil kunne samle ~ 250.000 Prodigy-prosessorer i et nettverk som er i stand til å kjøre menneskelige hjerneformede nevrale nett. Prodigys bearbeidingsdensitet, kombinert med forstyrrende lavt strømforbruk, gjør at disse systemene kan bygges fra og med 2020.
6. Ledelsen av Tachyum var involvert i salget av Skyera til WDC. Oppbevarer lagring og beregning derfor de samme fundamentale problemstillinger?
Tachyum og Skyera er to helt forskjellige selskaper, bortsett fra at noen grunnleggere av Tachyum var på Skyera. Vi gjør ingen krav om lignende skaleringsproblemer mellom minnet og prosessor domenene.
7. Vi snakket mye om maskinvare, men hvilken rolle programvare i planene dine?
Vår smarte kompilator er viktig for Prodigy-løsningen, og håndterer mange prosessoroppgaver som tradisjonelt håndteres i maskinvare. Vi har GCC i dag, og vil gi LLVM neste år, så vel som Java JIT. Linux og FreeBSD vil bli støttet internt. Vi vil jobbe tett med applikasjonsutviklere for å sikre at de fullt ut kan utnytte Prodigys ytelsesegenskaper for både datasenterapplikasjoner, samt AI-applikasjoner på alle domener.
8. Hva er forretningsmodellen din? Har du tenkt å lisensiere IP til tredjepart (ligner Rambus og Arm) eller har du tenkt å ta på hele markedet?
Tachyum er et halvlederfirma. Vi selger sjetonger til sluttkunder, ODM og OEM. Tachyum er ikke en IP-leverandør.
- Tachyum CPUer vil konkurrere med Intel Xeon (funnet på arbeidsstasjoner) og AMD Epyc-prosessorer i datasenterets arena.