Strojové učení, AI ve sportovních datech a odhalování podvodů
Níže SCCG Research zkoumá vývoj technologie AI, kam by se mohla ubírat dál a jak ji mohou operátoři využít. Tento úryvek je exkluzivní pro Gambling Insider a představuje náhled širšího výzkumu SCCG.
Od Gambling Insider
Všechny vědecké pokroky jsou založeny na práci vědců, kteří byli před nimi. Přesto minulá generace nepřipevnila raketové balíčky na boty příští generace datových vědců a nevystřelila je do vesmíru, protože jejich ramena byla unavená. Byla to komerční poptávka po výpočetním výkonu, která odemkla exponenciální růst schopností a dosahu AI a ML.
Za prvé, zvyšující se potřeby herního průmyslu na PC začaly přimět designéry a výrobce, jako je Nvidia, k vytváření stále výkonnějších grafických procesorových jednotek (GPU) nezbytných pro počítače, konzole a hry nové generace. Dále rozmach kryptoměn vyvolal poptávku po výkonnějších GPU, protože tokeny, jako je bitcoin, vyžadují více práce k těžbě dalšího a jsou stále vzácnější.
Výrobci GPU již nebyli primárně závislí na diskreční (a masivní) kupní síle hráčů. Odemkli zcela nový trh, který doslova vytvářel bohatství ze vzduchu – hory imaginárních digibucks, které hnaly další investice a pokrok ve vývoji procesorů GPU. Tento cyklus zpětné vazby přispěl k tomu, že Nvidia má dnes tržní kapitalizaci kolem 3,1 bilionu dolarů – třetí nejhodnotnější společnost na světě.
Dále přišli datoví vědci, kteří viděli, jak výrobci GPU chrlí tento neuvěřitelně výkonný hardware, který na rozdíl od výkonné výpočetní jednotky PC, centrální procesorové jednotky (CPU), urychluje specifické úlohy, jako je násobení matic – přesně to, co modely ML potřebují ke škálování. množství parametrů, které musí zvládnout, aby mohli rychle vytvářet cenné předpovědi.
S komoditizací obrovské moci, kterou AI/ML mohla poskytnout každé společnosti, mohla každá z nich získat šanci na členství v Avengers.
Pro většinu lidí je těžké si představit, jak velký skok jsme udělali, pokud jde o paralelní zpracování a velikost modelů AI/ML, ale dovolte mi to zkusit.
Představte si datového vědce doma, jak zalévá trávník obyčejnou starou zahradní hadicí (ano, chápu, jak je nepravděpodobné, že by si zaměstnaný datový vědec zaléval hadicí vlastní zahradu, ale tady se mnou pracujte). Ta zelená pruhovaná hadice má průtok asi 10 galonů za minutu. Představte si to jako kapacitu GPT-3.
Nyní si představte úplně jiného datového vědce stojícího u konzole na vrcholu přehrady Hoover Dam, jednoho ze sedmi moderních technických divů Ameriky. Stisknou velké červené tlačítko na konzole, otevřou brány ve dvou masivních betonových přelivech a vyvrhnou 179 milionů galonů vody za minutu do žíznivé řeky Colorado pod nimi. Nebýt betonových kanálů a odbočovacích tunelů Hoover Dam, síla vody by vyletěla několik set stop, než by gravitace mohla začít zaplavovat údolí pod ní.
Hubice na zahradní hadici a vizualizace přepadu Hoover Dam je rozumné srovnání mezi GPT-3, vydaným v polovině roku 2020, a GPT-4, vydaným na začátku roku 2023, v reálném světě, tedy méně než tři roky od sebe. Podobný růst jsme viděli u LLM produktů Google BERT a následných produktů T5 a Switch Transformer. Aby společnost Microsoft dále rozšířila naši analogii s dalšími konkurenty, vydala Turing-NLG 17B a navázala s Turing-NLG 530B, přímým konkurentem GPT-4 co do velikosti a schopností – ne-li značky.
Stále je zde prostor pro růst, jak dokazuje tento článek, který přináší druhy specializovaných odstínů, které jste mohli vidět pouze v hypotetických budoucích produktech AI/ML, jako je OpenAI GPT-Hawaii 5o, Google Switch Transformer 2: Dark of the Moon nebo Turing od Microsoftu. -NLG 3825/QB4ABCDEFG. Přesto, vzhledem k Moorovu zákonu, jak daleko by to mohlo být?
Pro většinu lidí je těžké si představit, jak velký skok jsme udělali, pokud jde o paralelní zpracování a velikost modelů AI/ML
S využitím dnešních nehypotetických technologií tedy naše komerčně dostupné modely ML využívají složité algoritmy a podporují vektorové stroje, které pomáhají klasifikovat data, používají neuronové sítě k identifikaci vzorů a zvažují stovky miliard parametrů v masivním měřítku.
Jejich předpovědi poskytují provozovatelům sportovních sázek lepší kurzy, někdy dostatečně rychle na to, abychom našim zákazníkům poskytli příležitosti k sázení v reálném čase. Mohou se podívat na obrovské množství transakcí, identifikovat shluky nebo anomálie v datech a charakterizovat je jako potenciální podvod v rámci automatizace obchodních procesů. Ale jde o to. Až na několik výjimek se konkurenti v každém odvětví dívají na stejné soubory dat. Sportovní data mohou být vlastněna a licencována, ale existují veřejně. AI a ML využívají rámce, které se široce používají ve všech oblastech.
Komiksoví superhrdinové jsou tím, čím jsou, protože jsou ze své definice výjimeční. S komoditizací obrovské moci, kterou AI/ML mohla poskytnout každé společnosti, mohla každá z nich získat šanci na členství v Avengers.
Ale není tomu tak. V nadcházející stručné zprávě SCCG Research o AI a ML se budeme zabývat tím, proč tomu tak je. Jako rámec diskuse použijeme sportovní data a prevenci podvodů. Budeme také diskutovat o tom, jak tyto výkonné schopnosti řídí provozní změny v našem odvětví a co je třeba vzít v úvahu při jejich hodnocení z hlediska účelu.
Zdroj:www.gamblinginsider.com
Shrnutí
SCCG Research zkoumá vývoj technologie AI a možnosti využití pro operátory v herním průmyslu. Výzkum ukazuje růst výkonu GPU díky poptávce v herním průmyslu a těžbě kryptoměn. Datoví vědci využívají výkonná GPU k urychlení modelů ML a AI. Technologický pokrok umožňuje vytváření stále větších a efektivnějších modelů AI. Přestože existuje potenciál pro další růst, komoditizace technologie umožňuje větší přístup k výkonným algoritmům. Zatím se však konkurenti v různých odvětvích setkávají se stejnými daty. SCCG Research se zabývá vlivem AI a ML na odvětví a diskutuje o výzvách a přínosech těchto technologií.