Sztuczna inteligencja (AI) to nie tylko futurystyczny termin rodem z filmów science fiction. To coraz bardziej popularne i użyteczne narzędzia, które mogą pomóc Ci w wielu aspektach Twojej pracy i życia. AI może także zrewolucjonizować sposób, w jaki organizujesz i prowadzisz wydarzenia online.
Zastanawiasz się, po które rozwiązania sięgnąć i od czego zacząć? Eksperci ClickMeeting – Tomasz Bołcun i Paweł Łaniewski – opowiedzieli o tym podczas webinaru Wykorzystaj AI w swoich webinarach. Chat GPT i nie tylko! Poniżej obejrzysz nagranie wydarzenia, przeczytasz także relację tekstową.
Table of Contents
Narzędzia, które mogą Ci się przydać
Mówiąc o praktycznym zastosowaniu sztucznej inteligencji, zwykle mamy na myśli konkretne narzędzia, które mogą usprawniać naszą pracę w wielu obszarach. Podczas webinaru omówiliśmy kilka z nich.
Pierwsza kategoria narzędzi to cieszące się w ostatnim czasie olbrzymią popularnością rozwiązania wykorzystujące zaawansowane modele językowe, czyli:
- ChatGPT: dla wielu osób to wręcz synonim sztucznej inteligencji. Co ważne: wersja ChatGPT-3,5 jest darmowa i aby z niej skorzystać, wystarczy rejestracja. Jeśli chcesz sięgnąć po bardziej zaawansowaną wersję oznaczoną cyfrą 4, trzeba będzie zapłacić.
- Bing: innym bezpłatnym rozwiązaniem jest wyszukiwarka Bing stworzona przez Microsoft. Poza klasycznym oknem wyszukiwania możliwe jest również uruchomienie czatu, który pozwala m.in. na prowadzenie konwersacji i przygotowywanie treści.
- Bard: trzecią bezpłatną propozycją jest rozwijany przez Google Bard. Zasada działania jest taka sama, jak w pozostałych dwóch przypadkach.
Ale potencjał Sztucznej Inteligencji nie ogranicza się wyłącznie do modeli językowych. Eksperci zaprezentowali możliwości narzędzi, które sprawdzą się w konkretnych zadaniach:
- HeyGen pozwala na generowanie filmowych awatarów na podstawie przygotowanego wcześniej nagrania. W ten sposób możesz tworzyć na przykład prezentujące się świetnie wideo w dowolnych językach.
- DeepL to znakomite rozwiązanie, jeśli chcesz uzyskać wysokiej jakości tłumaczenie dowolnych treści. Jest dostępny również w bezpłatnej, w pełni funkcjonalnej wersji.
- Sonix świetnie sprawdza się przy transkrypcji nagrań. Obsługuje wiele języków i umożliwia skorzystanie z wielu dodatkowych funkcji. Bezpłatna wersja testowa pozwala na transkrypcję maksymalnie 30 minutowego nagrania.
O co chodzi z modelami językowymi?
Narzędzia wykorzystujące zaawansowane modele językowe to w ostatnim czasie prawdziwy hit szeroko wykorzystywany w wielu branżach, w tym w marketingu. To właśnie one pozwalają na tworzenie zróżnicowanych treści czy udzielanie odpowiedzi na pytania. Nadal stosunkowo często użytkownicy nie do końca rozumieją jednak, na czym opiera się ich działanie, wobec czego oczekują realizacji zadań, do których modele językowe po prostu się nie nadają.
O to, czym właściwie jest model językowy, zapytałem ChatGPT:
Model językowy to system sztucznej inteligencji zaprojektowany do rozumienia, interpretowania i generowania ludzkiego języka. Wykorzystując techniki uczenia maszynowego, w szczególności uczenie głębokie, modele te są trenowane na ogromnych zbiorach danych tekstowych, aby nauczyć się struktury i zasad języka naturalnego.
Istnieje kilka kluczowych funkcji modeli językowych:
- Generowanie tekstu: Modele mogą produkować koherentne i kontekstowo trafne fragmenty tekstu. Są używane w chatbotach, automatycznym pisaniu e-maili, tworzeniu treści i wielu innych zastosowaniach.
- Rozumienie kontekstu: Modele te potrafią interpretować znaczenie tekstu, biorąc pod uwagę kontekst. To pozwala im na lepsze odpowiedzi na pytania i bardziej precyzyjne analizy.
- Tłumaczenie językowe: Są zdolne do tłumaczenia tekstu między różnymi językami, zachowując znaczenie i niuanse oryginału.
- Sumaryzowanie tekstów: Mogą skracać dłuższe dokumenty do krótkich, zwięzłych podsumowań, zachowując kluczowe informacje.
- Przewidywanie tekstu: Model może przewidzieć kolejne słowo lub frazę na podstawie poprzednich, co jest używane w autokorekcie i asystentach do pisania.
- Analiza sentymentu: Modele te mogą ocenić emocjonalne zabarwienie tekstu, czyli określić, czy jest pozytywny, negatywny czy neutralny.
Czym jest prompt?
Drugim ważnym terminem jest prompt. Co to takiego? Znów poprosiłem o pomoc ChatGPT:
Termin “prompt” w kontekście sztucznej inteligencji i przetwarzania języka naturalnego odnosi się do wejściowego tekstu lub instrukcji, która jest podawana modelowi językowemu, aby wygenerować odpowiedź lub wykonać określone zadanie. W przypadku modeli generatywnych, takich jak GPT-3 czy GPT-4, prompt jest początkowym tekstem, który kieruje model do generowania kontynuacji tekstu, odpowiadania na pytania, tworzenia treści, a nawet rozwiązywania problemów.
W pewnym uproszczeniu prompt jest więc informacją, którą wprowadzasz do narzędzia, aby uzyskać określoną odpowiedź czy efekt. Prompty mogą mieć przy tym różny charakter. Obszary, których dotyczą, to między innymi:
- Rozpoczęcie procesu,
- Podanie kontekstu,
- Trening i uczenie,
- Instrukcje i zapytania,
- Interakcje z czatem,
- Formatowanie odpowiedzi.
Zwróć uwagę na ograniczenia: kwestia tokenów
Token to fragment tekstu, który może być pojedynczym znakiem, słowem, lub nawet kilkoma słowami w zależności od systemu tokenizacji (jak określa się proces dzielenia tekstu na tokeny). Jest to kluczowy krok w przetwarzaniu języka naturalnego (NLP), ponieważ pozwala modelom analizować tekst na poziomie słów lub znaków.
Modele językowe mają określony limit tokenów, który mogą przetworzyć jednocześnie. Na przykład GPT-3 ma limit 4096 tokenów. Oznacza to, że długie teksty muszą być skracane lub dzielone na mniejsze fragmenty, aby można było je przetworzyć. Dokładny limit tokenów dla poszczególnych modeli znajdziesz poniżej:
Proste przygotowywanie wideo awatarów z HeyGen
Przejdźmy do praktyki i do jednego z najbardziej innowacyjnych i zaskakujących sposobów wykorzystania sztucznej inteligencji, czyli tworzenia wideo awatarów.
Pewnie zdarzyło Ci się kiedyś spotkać w sieci materiał filmowy ze znanym politykiem, który z trybuny wygłasza poglądy, o które nie można by go podejrzewać? Albo chociażby Leo Messiego opowiadającego dowcipy… w języku śląskim?
Nawet w tym drugim przypadku nie tak łatwo zorientować się, że mamy do czynienia z przeróbką. Oczywiście tak zwany deepfake może mieć niszczycielską moc i tworzyć alternatywne, kłamliwe scenariusze, które nie mają nic wspólnego z rzeczywistością. Ale możemy wykorzystać tę technikę również w słusznej sprawie.
Dzięki HeyGen tworzenie własnych awatarów jest naprawdę proste. To narzędzie pozwoli Ci na przykład przygotować wideo promocyjne. I to w niemal dowolnym języku.
Jak to zrobić? Możesz posłużyć się jednym ze 100 gotowych awatarów AI, który będzie w stanie mówić jednym z ponad 300 głosów w ponad 40 językach. Ale nam zależy oczywiście na unikalności: awatar może wyglądać i mówić dokładnie tak, jak Ty czy Twoi współpracownicy. W tym celu konieczne będzie nagranie 2 minutowej próbki wideo, np. przy pomocy smartfona, kamery, aparatu cyfrowego czy kamery internetowej.
Po utworzeniu awatara możesz przystąpić do przygotowywania nagrań. Wystarczy, że wprowadzisz tekst, który ma wypowiedzieć awatar. Ruch ust, a nawet mimika i gestykulacja, zostaną automatycznie dostosowane, aby uzyskać naturalny efekt.
Jak naturalny? Podczas naszego webinaru udowodniliśmy, że naprawdę łatwo się pomylić.
Dzięki awatarom stworzonym przez HeyGen możesz tworzyć naprawdę zróżnicowane materiały wideo. Na przykład zaproszenia na webinar. Dokładnie w taki sposób, w jaki zrobiliśmy to w ClickMeeting:
To oczywiście znakomity sposób na przygotowanie wideo w języku, którego nie znasz – awatar wypowie kwestię Twoim głosem (co więcej, HeyGen może również wykonać tłumaczenie, choć w tym aspekcie lepiej sprawdzi się DeepL). Ale awatar może usprawnić również tworzenie wideo w języku polskim. Tylko o tym pomyśl: nie musisz za każdym razem przygotowywać się do nagrania, rozstawiać sprzętu, uczyć wypowiedzi na pamięć (albo nie uczyć, ale robić kilka dubli). Po przygotowaniu awatara wystarczy wprowadzić tekst i gotowe!
ChatGPT i odgrywanie ról
Etap przygotowań do webinaru to nie tylko opracowywanie materiałów promocyjnych. To także kwestie merytoryczne. Zasada jest przy tym prosta: musisz jak najwięcej dowiedzieć się o swoich odbiorcach, aby zaproponować im treści jak najlepiej dostosowane do ich oczekiwań.
Oczywiście w scenariuszu idealnym możesz zapytać przedstawicieli grupy docelowej bezpośrednio o to, o czym chcieliby usłyszeć. Niestety nie zawsze będziesz mieć taką możliwość. Ale w tym kontekście znakomicie sprawdzi się sztuczna inteligencja, która z naprawdę sporą łatwością wciela się w rolę.
Na początek krótkie ćwiczenie: Bard oraz ChatGPT-3.5 mają za zadanie wcielenie się w rolę Steve’a Jobsa i udzielenie odpowiedzi na pytanie, czym powinno wyróżniać się dobre oprogramowanie do webinarów.
Prompt może wyglądać w następujący sposób:
I want you to act like Steve Jobs, Apple founder. I want you to respond and answer like Steve Jobs using the tone, manner and vocabulary Steve Jobs would use. Do not write any explanations. Only answer like Steve Jobs. You must know all of the knowledge of Steve Jobs. My first sentence is “Steve, what should the best webinar software have to be competitve on the market.”
Odpowiedzi znajdziesz poniżej:
W ten sposób możesz porozmawiać nie tylko z wirtualną wersją powszechnie rozpoznawalnych osób. Wprowadzając odpowiednie dane, będziesz w stanie porozmawiać ze swoim potencjalnym odbiorcą.
Wszystko jest kwestią dobrze napisanego promptu, a zasadniczo promptów, bo w tym przypadku potrzebnych będzie nieco więcej interakcji z czatem. Najpierw musisz podzielić się z nim najważniejszymi danymi, na przykład charakterystyką swojej grupy docelowej. Możesz wprowadzić tekst w oknie czatu, ale również skorzystać z zewnętrznego pliku. Następnie możesz dopytywać o interesujące Cię aspekty, na przykład tytuły webinarów, jakie zainteresowałyby Twojego potencjalnego odbiorcę.
Oto przykładowe prompty:
- Oto informacje / pod tym linkiem znajdziesz informacje o grupie docelowej / odbiorcach webinaru…. (tekst, link do strony, dokument) Przeanalizuj je i zapamiętaj te dane jako ”grupa docelowa X” Będę Cię o nią pytał w przyszłości.
- Potwierdź, czy i jak zrozumiałeś zadanie.
- Od teraz przyjmiesz rolę…” (typowego przedstawiciela grupy docelowej X) “Odpowiedzi udzielaj tak, by brzmiały jak wypowiadane przez przedstawiciela grupy docelowej…
- „Zaproponuj 3 tematy webinarów”; „na które z podanych tematów byś przyszedł” „Zaproponuj agendę…”; „Jakie pytania byś zadał…”
Sztuczna inteligencja, która będzie dysponować tak dużą wiedzą na temat Twojej działalności i grupy docelowej, będzie pomocna na wielu etapach przygotowań do wydarzenia. Możesz w ten sposób stworzyć na przykład kompletną agendę webinaru i poznać pytania, jakie mogliby zadać jego uczestnicy.
Tutaj znajdziesz konwersację z ChatGPT-4.
Poszukiwanie webinarowych inspiracji i analiza nagrań
Konwersacja ze sztuczną inteligencją może przynieść Ci naprawdę sporo pomysłów na kolejne wydarzenia. Ale świetnym źródłem inspiracji jest też analiza tego, co zrobili inni. Aby znaleźć informacje o webinarach, możesz posłużyć się integracją Barda z YouTube.
Przykładowy prompt, który pozwoli Ci na znalezienie najbardziej anagażujących webinarów dla nauczycieli:
@YouTube znajdź nagrania webinarów w języku polskim przeznaczonych dla nauczycieli, które były najbardziej angażujące i zostały przeprowadzone w ciągu ostatnich 12 miesięcy. Przyjmij jako kryteria zaangażowanie (liczbę pytań w trakcie webinaru, liczbaęuczestników, liczbę komentarzy pod nagraniem). W pierwszej kolejności wyświetlaj te nagrania, które mają najwięcej wyświetleń.
W tej konwersacji Bard przygotował zestawienie takich webinarów. Poza tym dołączył do niej również krótkie opisy, które mogą okazać się pomocne we wstępnej ocenie zawartości nagrań.
Ale co jeśli chcesz dowiedzieć się więcej bez oglądania, w tym np. poznać możliwe niedociągnięcia, co może być niezwykle pomocne, jeżeli chcesz udoskonalać własne webinary? Również w tym przypadku możesz poprosić Barda o pomoc.
Prompt, który Ci na to pozwoli, może brzmieć np.:
[link na YouTube] – przeanalizuj nagranie tego webinaru. Wskaż jego mocne strony od strony prezentacji i rzeczy, które są do ewentualnej poprawy. Zrób podsumowanie prezentowanych treści, dodaj informacje o prowadzących, dodaj informacje o organizatorze.