YodaQA, týden třetí

Včera jsem si odchodil dalších 24 hodin, co mám týdně. (3 krát 8 hodin)  Dvakrát se něco rozbilo a já to musel trochu v panice opravovat, protože už jsem to odeslal do hlavní větve. Nakonec jsem ale to webové rozhraní vylepšil, teď se u jednotlivých odpovědí zobrazují odkaz strategie, jak k nim YodaQA dospěl, což v praxi znamená jenom "hledal jsem v celém dokumentu, hledal jsem v názvu, hledal jsem v strukturované databázi. Přímo důvody mě ještě čekají, to bude trvat déle.

 Vtipné bylo, že v úterý jsem musel místo programování testovat naší filmovou odnož a to spočívalo v tom, že jsem měl otevřený spreadsheet a do toho si zaznamenával otázky a odpovědi. Vtipné to vlastně není. Je to příšerný vopruz. U generických otázek to alespoň občas dá nějakou překvapivou otázku, ale tady strojově (chápete? strojově, hahahaha) hledáte mezi 25 nabízenými větami správnou odpověď.

Zatím náš systém docela selhává, i otázky typu "kdo režíroval X" občas posere. Problém je trochu v tom, že YodaQA je navržený jako tkz. open domain systém, což znamená, že by měl tak nějak odpovědět na cokoliv. A naše "demo" (které spíš musíme udělat, abychom měli co prezentovat) je zase closed domain, protože tam zhruba víme co se bude hledat a můžeme to patřičně optimalizovat. 

Osobně mi to přijde, jako byste vzali krásného svobodného fénixe, usekli mu křídla, trošku oškubali peří na krku, nasprejovali ho na modro a pak ho strčili do klece.

Mentor se mě následně zeptal, jak bych udělal odpovídání na otázky typu Yes/No, tak jsem mu řekl, že v některých případech bych prostě dal fulltextové vyhledání v dané stránce a vrátil bych, jestli se  tam daná věc vyskytuje, což je extrémně naivní a v open domain by to rozhodně neprošlo. Podobný komentář jsem taky očekával, ale místo toho jsem dostal "Paráda, tak to budeš dělat." 

Ooops.

Ve středu ráno byly prezentace. Přišel jsem sice pozdě, ale přinesl jsem jim upečené kokosky, což sklidilo kladný ohlas. V našem týmu jsou kromě mě a mentora ještě 3 lidi a každý dělá na něčem úplně jiném. Jeden dělal rozhodovací stromy zároveň s přidáním Bing vyhledávání, druhej vektorovou reprezentaci otázek a třetí mění webové rozhraní. Jeho práce se od mé liší tak, že já upravuju "co se posílá na web" a on to na tom webu "jenom" hezky vypíše, což je trochu jiná a podle mého názoru ještě horší sada problémů. Webdesign mi nikdy nešel.

Tak nějak mají ostatní takové hezké věci, o kterých se dá dlouho povídat, zatímco já mám "no, tak jsem se hrabal hodně hluboko v kódu abych vytáhnul nějaké informace". Upravuju samotný engine v pozadí. Nezní to prostě moc.. náročně? Ne, že bych si chtěl stěžovat na snadnost úkolu, protože to bylo brutální. Jenom se s tím nedá tolik vytahovat. Posledně jsem řekl, že jsem asistent na všechno a to tak nějak platí.

Líbí se mi ale to, že jak pracujeme v týmu, tak to všechno spěje k nějakému zlepšení systému. Máme naše "větve", které se časem sjednotí v master branch a prostě to bude mít novou/lepší funkcionalitu. Každý dělá svůj kus, občas je něco prerekvizita, aby fungovala jiná část.

Komentáře

Populární příspěvky z tohoto blogu

Asian Squad

Dormking

Creating my own Point of Sale system, Part 1: Design