ChatGPT agentissa on potentiaalia, mutta toistaiseksi se on harvoin hyödyllinen
OpenAI:n agentit lupaavat "tekevän töitä puolestasi ja hoitavat monimutkaisia tehtäviä alusta loppuun." Mutta toimivatko ne oikeasti?

OpenAI:n heinäkuun puolivälissä julkaisema ChatGPT agent on todellista ATK:ta. Tuttuun tapaan käyttäjä kirjoittaa kehotteen selaimeen, mutta sen jälkeen alkaa tapahtua kummia.
Agentti käynnistää virtuaalikoneen, jossa se esimerkiksi käyttää selainta tai suorittaa Linux-komentoja tarpeesta riippuen. Käyttäjä näkee jatkuvasti, miten operaatio etenee ja voi tarvittaessa myös keskeyttää tehtävän. Agentti osaa pyytää käyttäjältä apua, jos on tarve vaikkapa kirjautua johonkin palveluun tai suorittaa luottokorttimaksu.
Työskentelyn jälkeen agentti voi pulauttaa tekstin sijasta myös esimerkiksi Excel-, Word- tai PowerPoint-tiedoston käyttäjän pyynnöstä riippuen. 23 euroa kuukaudessa maksavalla ChatGPT Plus -tilauksella voi tehdä julkaisuhetkellä 40 ChatGPT agent -kyselyä kuukaudessa.
Agentti on toteutettu yhdistämällä verkkohakuja hyödyntävä OpenAI:n Deep research sekä selainta käyttävä Operator. Lopputuloksen toiminta selviää parhaiten parin esimerkin avulla.
Matkasuunnitelman tekeminen
Pyysin agentita antamaan ehdotuksia lomakohteiksi Eurooppaan syyskuussa. Kehotteeksi kirjoitin:
"Act as an expert travel agent. My friend and I want to plan a trip from Helsinki, Finland in September to a city we've never visited. Trip will be from 1.9.2025 to 6.9.2025. Our budget is around €1000 per person after flights. We love great street food, technology, and walking around interesting neighborhoods. We don't care for late-night clubbing.
Please suggest five European cities that would be a good fit. For each city, explain why it matches our interests and create an itinerary for the trip for each day in the city. Also suggest flights from Helsinki and accommodation."
Agentti käynnisti virtuaalikoneen ja alkoi etsiä tietoa sen sisällä pyörivän selaimen avulla. Kone rouskutti 15 minuuttia kunnes ilmoitti tehtävän valmistuneen. Agentti ei hermostu, vaikka selaimen välillä sulkisikin. Kun työ on tehty, lähetetään puhelimen ChatGPT-sovellukseen notifikaatio.
Agentti otti hyvin huomioon vaatimukset ja teki ehdotuksen viidestä kaupungista sekä suunnitelman jokaiselle matkapäivälle. Vaikuttavaa, mutta tein vertailun vuoksi pelkän Deep research -kyselyn samalla kehotteella. Aluksi palvelu kysyi tarkentavia kysymyksiä ja toteutti huomattavasti kattavamman vertailun vain kahdeksassa minuutissa.
Vertailu teknologiamuseoista
Seuraavaksi pyysin agenttia tekemään PowerPoint-esityksen kymmenestä maailman parhaasta videopelimuseosta. Jokaisesta museosta piti luoda kaksi kalvoa: ensimmäiseen lyhyt kuvaus museosta ja toiseen kuvia. Esityksen loppuun halusin vielä vertailun kaikista valituista museoista. Kehote oli kokonaisuudessaan:
"Create a slide presentation of the 10 best video game museums to visit in any country in the world. Each museum must have two slides: one with a title and key bullet points and the second one containing some photos. The final slides must compare the museums and give recommendations."
Esityksen luominen kesti 40 minuuttia. Selaimen käytön lisäksi virtuaalikoneessa suoritettiin läjäpäin Linux-komentoja. Lopputuloksena oli sangen massiivinen 45 megatavun PowerPoint-tiedosto. OpenAI on varoittanut, ettei agentti ole vielä erityisen pätevä luomaan esityksiä ja oma kokemukseni vahvistaa tämän. Voit ladata esityksen (PDF-tiedosto) klikkaamalla tästä.

Pyynnön mukaisesti jokaisesta museosta luotiin kaksi kalvoa. Ensimmäinen kalvo sisälsi museon nimen ja muutaman rivin yhteenvedon, kuten pitikin. Jälkimmäisellä kalvolla piti olla kuvia museosta, mutta kuvat olivat sekaisin ja samat kuvat esiintyivät useiden museoiden kohdalla. Ehkä ChatGPT ymmärsi väärin termin "some photos" eikä ymmärtänyt, että haluan näiden kuvien liittyvän kyseiseen museoon, mutta asiayhteydestä tämä olisi pitänyt pystyä päättelemään. Kuvien joukossa oli myös monta kertaa agentin itsensä luoma kuva taulukosta, jossa valitut museot on listattu.
Myöskään esityksen järjestys ei mennyt putkeen. Jostain syystä museovertailun ensimmäinen kalvo on sivulla 12 ja jälkimmäinen sivulla 23, vaikka niiden piti olla tietysti peräkkäin esityksen lopussa.

Connectorien avulla kiinni omaan tai yrityksen dataan
Agentti osaa hyödyntää muiden OpenAI:n palveluiden tapaan myös useiden SaaS-palveluiden dataa connectorien avulla. Niitä hyödyntämällä agentti pääsee käsiksi esimerkiksi Microsoftin ja Googlen sähköpostiin, kalenteriin, Google Driveen tai OneDriveen. Myös sähköpostien lähettäminen ja kalenteritapahtumien lisääminen onnistuu. Custom connectorin avulla agentti osaa myös hyödyntää mitä tahansa palvelua, jolle on olemassa MCP-palvelin. Valitettavasti ChatGPT Plus- tai Pro-tilauksella ainoastaan GitHub connector on Euroopassa toistaiseksi käytettävissä, mutta yrityskäyttäjien Team-tilaus sisältää kaikki connectorit.
Vaikka ChatGPT agent on teknisesti sangen vaikuttava, on sille nykymuodossa vaikea keksiä käyttökohteita. Esitysten tekemiseen se ei vielä ole riittävän kehittynyt, eikä se osaa hyödyntää käyttäjän koneelle asennettuja ohjelmia. Jos tekstivastaus riittää, Deep research voi antaa saman tai jopa paremman lopputuloksen nopeammin.
--
Tämän blogikirjoituksen kirjoitti Kodanin AI Lead Pasi Kovanen. Pasin juttusille pääset helpoiten LinkedIn-palvelussa tai sähköpostilla: pasi.kovanen@kodan.fi