Tento článok Za scénami bol poskytnutý LiveScience v spolupráci s Národnou vedeckou nadáciou.
Musím mačiatka milovať. Vďaka nim je databáza zvukových záznamov Najvyššieho súdu USA teraz voľne dostupná verejnosti. Príliš veľa úsekov? Nie je to tak, pretože tento nástroj vyrastal z lásky jedného muža k Chicago Cubs, technológie a štúdia práva.
Jedno slnečné popoludnie na Wrigley Field pred 20 rokmi, Jerry Goldman, profesor politológie na Severozápadnej univerzite, sedel v tribunách a užíval si hru s niekoľkými študentmi. Zvážili spôsoby, ako je baseball metaforou najvyššieho súdu USA: deväť hráčov, deväť sudcov. Jedna hra zapína úžasné výšky a úžasné úlovky; druhý sa týka ústnych argumentov a premyslených rozhodnutí.
Ak baseballové karty vysvetlili dôležité informácie o hráčovej kariére, Goldman prišiel na to, prečo nevytvárať karty pre sudcov a pridávať video a audio? Tento projekt sa zdal dosiahnuteľný, vzhľadom na príchod HyperCard, aplikačného a programovacieho nástroja pre rané počítače Apple. „Moji kolegovia si mysleli, že som blázon,“ hovorí Goldman, teraz profesor na Illinois Institute of Technology (IIT), Chicago-Kent College of Law. "Ale ja som veril, že informačné technológie zmenia spôsob práce sveta."
Goldmanova snaha „skutočne humanizovať Najvyšší súd“ viedla k vývoju Oyez Project financovaného z NSF, multimediálneho archívu, ktorý obsahuje prehľadateľnú ukážku ústnych argumentov, ktoré súd počul od roku 1955. Aplikácia pre mobilné zariadenia, ISCOTUSteraz je tiež k dispozícii.
„Hlavným cieľom bolo zbaviť súdu výnimočného stavu a zverejniť ho,“ hovorí Goldman. „Chceli sme tiež sprístupniť obrovské množstvo údajov spojených so súdom.“
Vytváranie prehľadávateľného zvuku a videa
Aby oživil Najvyšší súd, Goldman najprv presvedčil Národný archív, v ktorom sú uložené zvukové súbory súdu, aby mu umožnil kopírovať pásky na prepis a digitalizáciu. Aby bolo možné nové digitalizované audiopásky prehľadávať, Goldman spolupracoval s Markom Libermanom, profesorom výpočtovej lingvistiky na Pensylvánskej univerzite. Liberman prispôsobil algoritmus, ktorý dokáže porovnávať zvuky na zvukových páskach s písanými prepismi. Táto práca nakoniec viedla k vývoju Penn Forced Aligner, nástroja, ktorý sa v súčasnosti bežne používa na zarovnávanie hovorených zvukov s písaným textom.
„V podstate sme vytvorili vyhľadávací nástroj pre audio a video nahrávky podobný prehliadaču Google,“ hovorí Liberman, ktorý bol k úlohe priťahovaný kvôli hodnote archívov pre vedcov a verejnosť. Uvítal tiež príležitosť vytvoriť vyhľadávaciu techniku použiteľnú pre rastúce zbierky zvukových a obrazových záznamov dostupných z nespočetných zdrojov.
„Dokázali sme vytvoriť model, ako pristupovať k vyhľadávaniam nákladovo efektívnym spôsobom. Môže sa to zdať ako veľký projekt, ale v porovnaní s tým, čo je teraz k dispozícii online a čo bude v budúcnosti, je malý, “hovorí Liberman.
(Libermanov kolegovia z Oxfordskej univerzity a Britskej knižnice nedávno používali nástroje na zarovnanie na dešifrovanie záznamov Britského národného korpusu, archívu s hovorenou časťou 100 miliónov slov získaných od účastníkov, ktorí zaznamenali prejav na Sony Walkmans.)
Analýza údajov
Ďalej Goldman analyzoval takmer 14 000 hodín zvuku ústnych argumentov Najvyššieho súdu. „Existuje veľa otázok, ktoré môžete položiť o súbore údajov,“ hovorí. „Je to však nezvyčajný súbor údajov, pretože má viac reproduktorov a je spontánny.“ Jednou z prvých úloh bolo identifikovať každého rečníka v každom ústnom argumente - výzva, pretože do argumentu sa mohlo zapojiť zhruba 11 rečníkov. Okrem toho sa v prepisoch mnoho rokov neoznačovali otázky súdnymi menami.
Goldman a jeho spolupracovníci, medzi ktorých patrili aj kolegovia z Carnegie Mellon University a University of Minnesota, zhromaždili pri riešení týchto výziev od roku 1955 niekoľko zaujímavých faktov:
- 32 sudcov za 58 rokov
- 8 600 obhajcov, z ktorých 70% sa dostavilo pred súd iba raz
- Hovorí sa 66 miliónov slov
- Viac ako 6 100 prípadov a viac ako 2 300 oznámení o názoroch
- Najdlhší argument - 1300 minút
- Najkratší argument - 14 minút
Spravodlivosť Antonin Scalia, ktorý slúžil dvadsaťsedem rokov pred súdom, je držiteľom rekordu 7 200 minút, zatiaľ čo Felix Frankfurter, ktorý slúžil 23,5 roka, sa blíži o 7 000 minút. Najviac zdržanlivými sudcami sú Sherman Minton a Clarence Thomas. Hoci Minton slúžil na súde sedem rokov, zaznamenáva sa iba jeho posledný rok. Počas svojho posledného funkčného obdobia je vypočutý iba 17 minút. Thomas, na súde od roku 1991, sa otvára o 23 minút.
Zatiaľ čo projekt Oyez poskytuje právnym odborníkom množstvo materiálu na ťažbu, výskumníci v lingvistike analyzujú záznamy pre rôzne štúdie.
Súd s ľuďmi
Aby sa zaistilo, že verejnosť a akademickí pracovníci budú môcť údaje ľahko zisťovať, tím spoločnosti Goldman pokračuje v vylepšovaní a vývoji rozhrania. Na jeseň roku 2013 sa do dátového systému pridajú vyhľadávacie funkcie, ktoré pomôžu používateľom ponoriť sa hlbšie do materiálu. Táto nová schopnosť vyhľadávania napríklad umožní používateľom „hľadať výraz„ prísna kontrola “, vidieť ho v prepise, počúvať ho a potom robiť s tým, čo s ním budú chcieť robiť poslucháči,“ vysvetľuje Goldman.
Chicagoans radi hovoria: „Nerobte si malé plány.“ Goldman je verný tomuto tvrdeniu. Chce aplikovať nástroje vyvinuté v projekte Najvyššieho súdu na všetky odvolacie súdy USA. Plánuje sa vývoj webových stránok a aplikácií mobilných zariadení. Knight Foundation nedávno udelila projektu Oyez 600 000 dolárov na vykonanie tejto práce pre najvyššie štátne súdy v Kalifornii, Floride, Illinois, New Yorku a Texase.
„Aplikácie sú najúžasnejšou časťou,“ hovorí Goldman. Budú sledovať návrh ISCOTUSteraz, čo je úsilie o spoluprácu medzi Goldmanom a Caroline Shapiro, tiež profesorkou na IIT Chicago-Kent College of Law. ISCOTUSteraz poskytuje prístup ku všetkému, čo je na súčasnom zozname najvyšších súdov, a zahŕňa zvuk a prepisy. Jednoduchým pohybom môže používateľ listovať prepisom, prehľadať ho a zdieľať sekciu s kolegami. "Najlepšia časť?" hovorí Goldman. „Všetky tieto informácie sú bezplatné.“
Rozsah projektu Oyez bol jeden Goldman, aký si nikdy nedokázal predstaviť. "Bez podpory NSF by sme sa stále snažili," hovorí. "Podpora NSF mi dala odvahu myslieť si len málo myšlienok."
Poznámka editora: Vedci uvedení v článkoch v zákulisí boli podporovaní Národná vedecká nadácia, federálna agentúra poverená financovaním základného výskumu a vzdelávania vo všetkých oblastiach vedy a techniky. Všetky názory, nálezy a závery alebo odporúčania vyjadrené v tomto materiáli sú názormi autora a nemusia nevyhnutne odrážať názory Národnej vedeckej nadácie. Pozri Za archívom scén.