29.9.2017
Dostala jsem za úkol nakrmit daty naši umělou inteligenci v programu »Artificial Intelligence Photovoltaic Analyser«. Petr Bravenec už o neuronových sítích napsal článek: Programování s neuronovou sítí z pohledu programátora. Já vám nyní můžu nabídnout pohled z pozice bičovaného zločince využitého při trénování neuronové sítě.
Příprava podkladů pro nácvik neuronové sítě je neuvěřitelně piplavá a zdlouhavá práce. V databázi prý máme k dispozici skoro deset miliónů grafů. Když jsem to slyšela, oblilo mě horko při představě, že budu muset všechny ty grafy projít a označit. Naštěstí stačilo, že jsem označila jen něco málo přes sto tisíc grafů. Jednak jsem na to nebyla sama, dalších sto tisíc grafů označili kolegové, ale hlavně se neuronová síť dokázala naučit spoustu věcí i z takto omezeného množství.
Na každém grafu jsem hledala šestnáct různých závad nebo vlastností. Na většině grafů samozřejmě nic závadného není, stačí pouze označit počasí (jasno, oblačno nebo zataženo) a uložit. Nesměla jsem však přehlédnout žádnou závadu, jaká je vidět třeba na tomto obrázku:
Každou závadu jsem musela označit myší a své hodnocení uložit do databáze.
Zavolejte: +420 777 566 384 nebo napište na adresu info@hobrasoft.cz
Jakmile se naše umělá inteligence naučila sama rozeznávat některé druhy závad, bylo potřeba porovnat, jak vyhodnotila závady neuronová síť a jak jsme vyhodnotili závady my, lidé. Často jsme se dostali do rozporů, protože neuronová síť viděla závady i tam, kde žádné závady nejsou, nebo naopak nenašla závady, které najít měla. Navíc jsme při označování grafů nasekali spoustu chyb, které bylo potřeba opravit, aby se neuronová síť neučila nesmysly. Mnoho grafů jsem proto musela projít znovu a označit je správně. Mnohokrát se také stalo, že neuronová síť měla na typ závady jiný názor, než já – někdy nelze jednoznačně rozhodnout, co je vlastně na grafu vidět.
Když byly sporné grafy opravené, natrénovali jsme síť znovu. Na tom pracoval náš nejvýkonnější počítač obvykle přes celou noc. Další den jsem pak opět musela vyřešit další porci špatně označených grafů.
Postupně mi takto prošel každý graf před očima snad desetkrát. K těm deseti miliónům grafů, ze kterých jsem měla strach ze začátku, má pouhý milión shlédnutých obrázků ještě daleko, ale i tak… je to prostě spousta práce.
Taky vám hvězdičky v grafu připomínají pavouky?