Umiejętności Jutra: AI 3.0 – Webinar na żywo – Tydzień 2. — Transcript

Webinar o prawnych aspektach AI i tworzeniu polskiego modelu językowego Bielik w ramach programu Umiejętności Jutra AI.

Key Takeaways

  • Użytkownik AI ponosi odpowiedzialność za treść wygenerowaną przez AI, szczególnie w kontekście ofert i komunikacji.
  • Program Umiejętności Jutra AI oferuje wsparcie i materiały edukacyjne, które należy realizować systematycznie.
  • Tworzenie lokalnych modeli językowych, takich jak Bielik, jest ważne dla ochrony danych i dostosowania do specyfiki rynku.
  • Porady prawne wymagają indywidualnej konsultacji z ekspertem, a webinar ma charakter edukacyjny i informacyjny.
  • Praktyczne ćwiczenia (AI laby) wspierają naukę i integrację społeczności uczestników programu.

Summary

  • Powitanie uczestników i podziękowanie za zaangażowanie w program Umiejętności Jutra AI.
  • Omówienie organizacji programu, w tym publikacji materiałów, zasad korzystania z Discorda i wsparcia technicznego.
  • Wyjaśnienie zasad aktywacji trzymiesięcznego okresu próbnego Gemini oraz podkreślenie, że płatne wersje narzędzi nie są konieczne do ukończenia programu.
  • Przedstawienie AI labów jako praktycznych ćwiczeń do wykorzystania zdobytej wiedzy.
  • Rozpoczęcie dyskusji z Pauliną Kowalską z Google na temat prawnych aspektów korzystania z AI.
  • Podkreślenie, że udzielane informacje nie stanowią porady prawnej, a jedynie wskazówki i drogowskazy.
  • Omówienie odpowiedzialności za błędy AI, w tym kto ponosi odpowiedzialność za błędne oferty wygenerowane przez AI.
  • Przedstawienie procesu tworzenia polskiego modelu językowego Bielik, jego etapów i wyzwań.
  • Dyskusja o znaczeniu lokalnych modeli AI i ochronie danych w kontekście polskiego rynku.
  • Zachęta do aktywnego udziału w społeczności Discord i dalszego rozwoju w programie.

Full Transcript — Download SRT & Markdown

00:01
Speaker A
[muzyka]
05:25
Speaker A
[muzyka]
05:42
Speaker A
[muzyka]
05:49
Speaker A
[muzyka]
06:01
Speaker A
[muzyka]
06:18
Speaker A
[muzyka]
06:37
Speaker A
[muzyka]
06:53
Speaker A
[muzyka]
07:10
Speaker A
[muzyka]
07:28
Speaker A
[muzyka]
07:45
Speaker A
[muzyka]
07:59
Speaker A
[muzyka]
08:18
Speaker A
[muzyka]
08:38
Speaker A
[muzyka]
08:58
Speaker A
[muzyka]
09:07
Speaker A
[muzyka]
09:25
Speaker A
Cześć. Witamy was serdecznie na naszym pierwszym webinarze trzeciej edycji Umiejętności Jutra AI. I dzięki, że jesteście z nami tu tak licznie. Przed chwilą usłyszałem, że jest was już ponad 8000, ale myślę, że ta liczba może jeszcze urosnąć, ale to świadczy o tym, że jesteśmy na żywo.
09:35
Speaker A
W ciągu najbliższych około 45 minut wspólnie zgłębimy kolejne aspekty prawne związane z pracą z narzędziami AI, o których często piszecie w opiniach i pytaniach do naszych lekcji z tygodnia pierwszego, a także poznamy kulisy tworzenia polskiego modelu językowego Bielik.
09:52
Speaker A
Zanim jednak porozmawiamy z naszymi gośćmi, mamy kilka ważnych informacji związanych z programem i ich przekazanie zajmie dosłownie kilka minut. Dlatego uprzejma prośba o odrobinę cierpliwości.
10:09
Speaker A
Po pierwsze, chcemy wam podziękować. Dziękujemy za wasze zaangażowanie w program, proces uczenia się, a także społeczność, którą współtworzycie razem z nami. Jest nas ponad 20 000 na Discordzie, a ta liczba cały czas rośnie. I z tego miejsca dzięki również za każdy wpis, każde pytanie, feedback i wzajemną pomoc, którą sobie udzielacie.
10:51
Speaker A
Nie ograniczacie się też do Discorda i myślę, że użytkownicy LinkedIna w Polsce również zauważyli obecność uczestników trzeciej edycji programu i to super, że dzielicie się tą wiedzą.
11:09
Speaker A
A odpisywanie na wiadomości czy komentarze, myślę, że wszystkim nam w zespole powoli wchodzi już w taką codzienną rutynę, ale daje też ogromną motywację do działania i to jeszcze lepszego, a wiele tygodni przed nami.
11:21
Speaker A
Widzimy też, jak wiele osób właśnie zalicza kolejne części programu na platformie i tutaj chciałbym was zachęcić do utrzymania tego tempa. Z doświadczenia poprzednich edycji naprawdę warto przechodzić przez ten materiał na bieżąco, ponieważ poziom trudności i ilość materiału w tygodniu drugim, co już mogliście zobaczyć, i w tygodniu trzecim będzie rosła.
11:34
Speaker A
Pamiętajcie też, że nie wszystkie materiały są obowiązkowe z uwagi na ich specjalizację w wybranym obszarze i w pierwszej kolejności skupcie się na tym, co stanowi fundament Umiejętności Jutra i jest dla was z perspektywy waszego stanowiska branży najważniejsze.
11:49
Speaker A
Po drugie, odpowiedzi na najczęściej pojawiające się pytania i zrobimy to krótko i zwięźle, punkt po punkcie, aby ułatwić nam tę wspólną drogę przez kolejne tygodnie programu. I mamy punkt pierwszy, czyli materiały na platformie. Te publikowane są, jak mogliście zauważyć, w poniedziałki o godzinie 20:00. Zawsze będziemy o nich informować was mailowo lub na Discordzie.
12:05
Speaker A
Punkt drugi, czyli Discord. I tutaj ważna uwaga. Jeśli już dołączyliście do społeczności, super, pamiętajcie o onboardingu. Otwórzcie kanał z ikoną kłódki o tajemniczej nazwie "Odblokuj dostęp" i upewnijcie się, że przeszliście właśnie przez proces onboardingu zgodnie z instrukcją, aby odblokować wszystkie pełne możliwości właśnie naszej społeczności.
12:22
Speaker A
Punkt trzeci to wsparcie uczestników. I mogę wam zagwarantować, że nasz zespół robi wszystko, co w ich mocy, aby odpowiadać na wasze pytania do 72 godzin w dni robocze. Dzięki za waszą cierpliwość i wyrozumiałość.
12:33
Speaker A
Punkt czwarty to aktywacja trzymiesięcznego okresu próbnego Gemini. I choć znaczna część z was aktywowała go z sukcesem, w przypadku problemów technicznych zerknijcie proszę w pierwszej kolejności na warunki podane w mailu z linkiem do aktywacji. A najczęściej pojawiające się wyzwanie dotyczy typu konta, na którym próbujecie aktywować ten dostęp. Przypominamy, że konto dla okresu próbnego musi być osobiste.
12:49
Speaker A
Punkt piąty. Pamiętajcie, że do ukończenia programu nie potrzebujecie płatnej wersji żadnego narzędzia, w tym choćby Gemini Pro.
13:07
Speaker A
I w końcu punkt szósty. AI laby. Są to praktyczne ćwiczenia, które mają na celu zachęcić was do praktycznego wykorzystania tej zdobytej wiedzy w praktyce jeszcze w trakcie trwania programu.
13:28
Speaker A
I tutaj na spokojnie, bo pojawiają się takie pytania. Nie musicie nigdzie przesyłać waszych wyników.
13:44
Speaker A
Zachęcamy was jednak do dzielenia się nimi, waszymi osiągnięciami i learningami, tym, czego się już nauczyliście, ze społecznością.
13:50
Speaker A
No i okej, te punkty mamy za sobą. Dzięki za waszą cierpliwość i jeśli chodzi o sprawy organizacyjne, myślę, że więcej takiej aktualności pojawi się w kolejnym webinarze.
14:01
Speaker A
Teraz przechodzimy już do tej głównej części, dla której pewnie tutaj wszyscy przyszliście, do głównej części webinaru i do naszych gości. A zaczniemy od rozmowy z Pauliną Kowalską, Corporate Counsel CE w Google, którą mogliście już poznać w pierwszym tygodniu programu. Za chwilę zaczynamy. Zostańcie z nami.
14:06
Speaker A
Okej. Paulina, pięknie ci dziękujemy za to, że przyjęłaś zaproszenie na dzisiejszy webinar i we wspomnianej lekcji wraz z Agatą mówiłaś o tym, jak uczestnicy mogą wykorzystywać właśnie do swojej codziennej pracy takie bezpieczne korzystanie i odpowiedzialnego za jaj kompas prawny.
14:18
Speaker A
Dzisiaj myślę, że troszeczkę to zgłębimy i tutaj w tym aspekcie, zanim pójdziemy o ten krok dalej i będziemy budować właśnie naszą rozmowę w oparciu o pytania, które zadają bardzo często uczestnicy naszego programu, zarówno minionej edycji, w której też byłyście obecne, jak i tej, mamy jeden ważny komunikat, który ustaliliśmy sobie właśnie przed webinarem.
14:35
Speaker A
Tak. Dziękuję ci bardzo, Michał, i bardzo miło mi się z tobą będzie rozmawiało. Dziękuję też wszystkim i zacznijmy od prawniczego disclaimera, bo to się musi tak zacząć. Nie ma wystąpienia prawnika bez disclaimera. Więc tak, to, o czym będziemy rozmawiali, to faktycznie są te wskazówki, to są drogowskazy, to są pytania.
14:48
Speaker A
Nie jesteśmy w stanie udzielić porady prawnej w takim formacie, jaki mamy. Mamy za mało szczegółów. To są pytania, które są tylko przyczynkiem do naszej dyskusji, do tego, żebyśmy mogli tak naprawdę krytycznie pozastanawiać się, jak podejść do jakiegoś problemu i jak go rozwiązywać i jak podejść do niego odpowiedzialnie.
14:54
Speaker A
Niestety, żeby dostać odpowiednią poradę prawną, po prostu należy skontaktować się z ekspertem, który musi poznać wszystkie szczegóły, żeby mógł odpowiedzieć wystarczająco dokładnie.
15:02
Speaker A
No i to myślę, że to jest też takie odpowiedzialne podejście, które chcemy zaszczepiać w programie. Dlatego, że gdybyśmy mieli rozmawiać o każdym z aspektów, każdej sytuacji, o której piszą nam uczestnicy programu, pewnie dotrwalibyśmy tutaj, myślę, że do szóstej lub siódmej edycji programu, a jeszcze ten webinar na żywo by trwał.
15:15
Speaker A
Ciekaw jestem, ile ludzi na żywo zostałoby z nami. Myślę, że bylibyśmy [śmiech] rekordy najdłuższego streama.
15:35
Speaker A
Ale wróćmy już właśnie do tej merytoryki i do tego zgłębiania pewnych aspektów, z którymi wracają do nas uczestnicy. Takich pytań mam trzy, ale każdy z nich pozwoli nam troszeczkę odbiec być może od tematu w inne aspekty prawne korzystania z AI.
15:43
Speaker A
I teraz na potrzeby tego webinaru pozwól, że wcielę się właśnie w taką rolę uczestnika Umiejętności Jutra. Chociaż nie ukrywam, że jako użytkownik technologii AI i narzędzi AI sam często sobie tego typu pytania zadaję.
15:56
Speaker A
I mamy pytanie pierwsze, które dotyczy odpowiedzialności za błędy popełniane przez AI. No bo nie można ukryć, że te błędy się zdarzają. Pytanie brzmi: AI wygenerowało ofertę z błędem w cenie, którą klient zaakceptował. Kto w łańcuchu — użytkownik, dostawca narzędzia czy twórca modelu — ponosi odpowiedzialność za skutki takiej pomyłki?
16:12
Speaker A
Odpowiadając bardzo krótko na to pytanie, co do zasady, zawsze ty jako osoba, która to wysyła, kto tak naprawdę składa to oświadczenie, odpowiadasz za jego treść i to jest początek odpowiedzi.
16:22
Speaker A
Już się bałem, że już wystarczy i że to jest na to odpowiedź. Wtedy webinar minie nam bardzo szybko.
16:36
Speaker A
Tak. No niestety, w tych odpowiedziach nie damy rady strzelać szybkimi pytaniami, odpowiedziami. Zazwyczaj jest więcej kontekstu i tak naprawdę ten kontekst daje ci pełne zrozumienie tematu. Więc zaczęliśmy od tego, że co do zasady to ty odpowiadasz.
16:50
Speaker A
Tak.
16:59
Speaker A
Dlaczego i skąd to wiemy? Czyli to, o czym mówiłyśmy z Agatą.
17:16
Speaker A
jakby zasilał je danymi odpowiedzialnie przez cały ten proces. To jest kwestia odpowiedzialności i bycia świadomym i rozważania ryzyk. Czy mogę, czy nie mogę, czy to jest dobry pomysł, czy może to jest średni pomysł, albo co zyskuję dzięki temu, że tu podoszę pewne ryzyko,
17:35
Speaker A
czy ono mi się opłaca tak naprawdę. Mhm. Całość polega na tym, że jesteś świadomym, jakby rozumiesz ryzyka i świadomie podejmujesz te decyzje.
17:43
Speaker A
Podejmowanie decyzji świadomie sprawia, że tak naprawdę jesteś ownerem tego procesu, jesteś odpowiedzialny i możesz tak naprawdę to nie jest wtedy tak wysokie ryzyko jak wtedy, kiedy nie nie masz tej świadomości. Uważam, że humanite to też jest tak naprawdę
17:59
Speaker A
zrozumienie tego, co chcesz osiągnąć i i zaprojektowanie całego procesu po to, żeby on był dla ciebie jak najbardziej optymalny i odpowiadał temu, jaki jest twój apetyt na ryzyko.
18:10
Speaker A
Jasne, jasne. To myślę, że tutaj sobie zapiszemy tak jak w trakcie inauguracji czy opisów, które tworzymy do pierwszego, drugiego tygodnia programu, wszędzie staram się przemycić coś, co my nazwaliśmy takim strategicznym kompasem.
18:23
Speaker A
yyy widzieć, wybierać, wdrażać. To teraz jeszcze w tym wszystkim powinniśmy zaszyć to Human in the lead jako rozszerzenie wcześniejszego konceptu Human in the loop. Myśląc o tym, że uczestnicy tej edycji programu, nie bez powodu nazywają się tak na Discordzie
18:40
Speaker A
jako społeczność liderów AI. Jeżeli chcą być tymi liderami, no to to pojęcie Human in the Delite idealnie do nas pasuje.
18:47
Speaker A
Wydaje mi się, że w tym przypadku to też jest kwestia tego, że wydaje, że większe, wiele osób uważa, że narzędzie zrobi za ciebie wszystko. Według mnie narzędzie dalej jest narzędziem. To jak ty wykorzystasz ten output i to tak
19:00
Speaker A
naprawdę w jaki sposób chcesz być liderem tej zmiany swojej, to dopiero daje ci pełne możliwości i tylko wtedy jesteś w stanie robić to.
19:12
Speaker A
z jak największym jak najlepiej dla swojej organizacji też dla siebie osobiście, bo ja na przykład wykorzystuję narzędzia AI też bardzo dużo dla swoich osobistych celów i uważam, że wtedy bycie świadomym co chcę osiągnąć i do czego tego to wykorzystać,
19:25
Speaker A
a potem ile potrzebne jest mojego autorskiego kontentu, żeby tak naprawdę osiągnąć pełną wartość, to jest tak naprawdę ta magiczna ten magiczny aspekt ja, który wtedy daje ci to bycie liderem, a nie tylko jakby bycie in the loop. Jasne. I teraz jakby wracając
19:42
Speaker A
jeszcze do samego być może początku tej tej treści pytania, w której mówimy, że AI wygenerował ofertę z błędem w cenie, którą klient zaakceptował, to zakładamy tutaj scenariusz pewnej autonomiczności działania AI, czyli dotykamy tematu, który dla uczestników pojawi się dopiero
20:00
Speaker A
w tygodniu trzecim, mówiąc o agentach AI na przykład. Yyy i to co możemy już teraz tylko wspomnieć, o czym też będziemy mówić w programie, to są różnego rodzaju zabezpieczenia, tak, które możemy wdrażać yyy w przypadku systemów agentowych czy nawet zwykłych
20:16
Speaker A
automatyzacji. I to jest kwestia znowu zaprojektowania całego procesu, zastanowienia się co warto, jakby jakie dać ograniczenia temu systemowi, tym agentom na zasadzie, nie wiem, może nie powinni mieć dostępu do całości, może powinni tylko przygotowywać pierwszy draft, który potem w ramach human in the
20:31
Speaker A
lead ktoś przejrzy i dopiero jak zostanie przejrzany, zweryfikowany, zaakceptowany, zostanie wysłany dalej. Może to jest kwestia zasetapowania systemu agentów. jeden, który sprawdza kolejnego yyy czy wieloetapowego weryfikowania albo też postanowienia, nie wiem, może są treści, które są okej za pierwszym razem, może są kluczowe
20:50
Speaker A
rzeczy dla naszej organizacji, które wymagają tego, żebyśmy na przykład zasetapowali w nim wieloetapowy system weryfikacji i tego human at the end, który musi na końcu dokonać tej ostatecznej weryfikacji. Poza tym są też metody na to, żeby nie nie chcemy, żeby
21:05
Speaker A
to była oferta. Może po prostu zaznaczmy w naszej komunikacji to nie jest materiał, przesłany materiał nie jest ofertą w rozumieniu kodeksu cywilnego.
21:15
Speaker A
Może wymaga to, nie wiem, skontaktowania się z konsultantem, przedstawicielem czy kimkolwiek. Znowu to jest bycie odpowiedzialnym i zasetowanie całego procesu, tak żeby działał dla naszej organizacji.
21:27
Speaker A
Jasne. Dobrze. To teraz myślę, że możemy już przejść do kolejnego pytania. To pytanie akurat też jest powiązane z popełnianiem błędów przy pracy z AI przez AI, no ale też przez nas, jeżeli nie sprawdzamy tego outputu, który AI wygenerowało. I tutaj y to kolejne
21:46
Speaker A
pytanie dotyczy takiego zjawiska, które jakby już teraz myślę, że odmieniane jest przez wszystkie przypadki w wielu organizacjach na całym świecie. shadow AI, czyli jakby tego wykorzystywania AI przez pracowników bez wiedzy na przykład pracodawcy.
22:01
Speaker A
I choć poruszaliśmy częściowo to zagadnienie, z tego co pamiętam w filarze czwartym waszej lekcji, jestem pilnym uczniem. Dokładnie to przeczytajmy sobie to pytanie. Wiele osób używa AI w pracy również prywatnie.
22:15
Speaker A
Nie polecamy. Bez oficjalnej zgody firmy, tym bardziej nie polecamy. Jakie ryzyko prawne ponosi pracodawca?
22:23
Speaker A
lub pracownik za wycieki spowodowane przez pracownika korzystającego z darmowych narzędzi pod tak zwanym biurkiem.
22:32
Speaker A
Tak jak rozmawia, jak zaczynaliśmy od początku mówić o tym czego nie polecamy, to nie polecamy korzystania z narzędzi niedostosowanych do danych potrzeb. Nie polecamy też, żeby pracownicy korzystali z nieaprobowanych czy nieautoryzowanych narzędzi e w pracy swojej codziennej. Jak do tego nie dopuścić, bo
22:54
Speaker A
to jest chyba cały znowu system zaprojektowany po to, żeby do tego nie dopuszczać. E, co do zasady pracodawca odpowiada za wyciek danych, czyli nie pracownik.
23:05
Speaker A
Odpowiedzialność pracownika w jest regulowana, jeśli to jest pracownik w rozumieniu kodeksu pracy, jest regulowana w kodeksie pracym w przepisach, standardowych przepisach kodeksu pracy.
23:13
Speaker A
I teraz poczułem, że rozmawiam z prawnikiem. [śmiech] Dziękuję bardzo. Widzisz, poczułeś się, że tak naprawdę jestem prawnikiem w tym setupie. Ale co do zasady to odpowiedzialność z oczywiście przewinienie nieumyślnej.
23:25
Speaker A
Mamy całe całą dodatkową historię, czy umyślna, czy nieumyślna, czy były, czy były odpowiednie procedury zestapowane przez pracodawcę, ale to jest przykrotność pensji, jeśli jest to pracownik. W rzadko którym przypadku wycieku danych to ma jakiekolwiek znaczenie, e, ale patrząc na to z
23:41
Speaker A
szerszej perspektywy, kiedy się tak dzieje, zazwyczaj działo będzie się tak, że pracownicy korzystają z nieautoryzowanych narzędzi, kiedy nie ma autoryzowanych narzędzi albo nie ma jasnych, wytycznych, z czego można korzystać. Ten brak autoryzowanych narzędzi, ten brak polityk czy brak
23:56
Speaker A
jasnych wytycznych też naraża pracodawcę na ryzyko, bo tak naprawdę dużo trudniej rozlicza się pracowników, którzy nie mają wytycznych. Dużo trudniej, oczywiście wtedy mamy ogólne przepisy i inne tego typu historie, ale wprowadzenie jasnych regulacji wewnętrznych, wprowadzenie jasnych polityk i znowu ta
24:15
Speaker A
odpowiedzialny wybór narzędzi, czyli to o czym mówimy cały czas od początku. Zastanówmy się, które narzędzia powinniśmy jakby uważać za bezpieczne w naszym setupie i do jakich celów. Czyli korzystamy z tych rozwiązań biznesowych dla biznesu, koniecznie konsumenckich do spraw prywatnych, tak,
24:33
Speaker A
na użytek y nasz własny. To też jest kwestia tego, jakie mamy priorytety. Jeśli nie chcesz, żeby model uczył się na twoich danych, to możesz wykorzystywać też jakby wersje niekonsumenckie do swoich prywatnych celów. To jest znowu, to jest znowu
24:46
Speaker A
jasne twój wybór. Tak. Ale to tego wyboru możesz dokonać tylko wtedy, kiedy wiesz co się kryje za każdą z tych opcji i podejmujesz go świadomie. Więc ja osobiście korzystam z wersji też niekonsumenckich dla swoich niektórych prywatnych celów, jeśli robię je, jeśli
25:04
Speaker A
nie chcę mieć tak, czyli takie ogólne przesłanie, jakbyśmy mogli sobie podsumować tą część pytania, warto tworzyć zasady, regulacje, choć one mogą być bardzo przyjemne czasem w formie czegoś, co pewnie w takim razie na Discordzie opublikuje jako inspirację manifestu AI,
25:25
Speaker A
pewnych zasad wewnętrznych. w organizacji nawet po pierwsze ambicji, co chcemy robić z AI, jakie zadania AI powinno dostawać, ale też w ogóle z perspektywy tego, co jest wartością naszej firmy, być może części zadań w ogóle temu AI nie powinniśmy powierzać,
25:39
Speaker A
a później dokładać do tego kwestie związane z ochroną danych użytkowników, klientów, wewnętrznych danych firmowych, podwykonawców.
25:48
Speaker A
To powinno być na pewno jakkolwiek poruszone dla bezpieczeństwa własnego pracownika, no i właściciela czy osoby zarządzającej firmą.
25:57
Speaker A
Rozmawiamy tu bardzo dużo o odpowiedzialności, ale też dużo jest zdrowego rozsądku. Danie sobie we zastanowienie się nad tymi punktami uważam za bardzo, za bardzo podstawowo, za bardzo podstawowy punkt wyjścia dla każdego, nie wiem, każdej firmy wdrażającej AI.
26:15
Speaker A
przejście przez te punkty, zastanowienie się co chcemy, czego nie chcemy, co chcemy umieszczać, czego nie chcemy umieszczać, w jakich narzędziach, jakich narzędzi chcemy wykorzystywać, nie wiem, jakie narzędzia będą okej do do generowania grafik, a jakie narzędzia będą lepsze do, nie wiem, analizowania
26:29
Speaker A
dużych dużych tekstów albo nie wiem, baz danych, albo do tworzenia czegokolwiek, kodu, może nie wiem, whatever.
26:35
Speaker A
To jest znowu proces świadomego korzystania i minimalizowania ryzyk. Mhm. Więc to jakby cała ta kwestia prawna polega też na tym, na zrozumieniu i minimalizowaniu ryzyka przez to, że świadomie podejmujemy decyzj też za pracowników, bo czy w innych aspektach
26:52
Speaker A
też podejmujemy takie decyzje w związku z tym jaki mamy apetyt na ryzyko. I wtedy jeśli dajemy jasne wytyczne, które zostały przemyślane, które też myślę, że często jest dobrze scroudsourceać pewne yyy pewne nie wiem rozwiązania, bo może nasi pracownicy będą nam w stanie
27:07
Speaker A
podpowiedzieć czego potrzebują, do czego oni korzystają jaj wcześniej. Jasne. No bo na koniec dnia jakby myśląc też o tych zasadach, y, tym odpowiedzialnym podejściu, to tak jak o tym rozmawiamy nie chodzi o to, żeby blokować nasze działania, ograniczać nas, przestraszyć
27:21
Speaker A
nas przed tym, bo jakby poczucie bezpieczeństwa korzystania, że mogę to robić, wiem w jaki sposób, wręcz może być zachętą do korzystania. Yyy uważam, że dla sceptyków yyy danie jasnych wytycznych jest wręcz pomocne. Jeśli ktoś wie, że robi coś, co jest okej, co jest
27:38
Speaker A
zaprobowane i też zostało sprawdzone, że to nie jest, nie wiem, yyy, jakiś eksperyment, który nie został zbadany, czy to jest bezpieczne, czy to jest niebezpieczne, czy to jest odpowiednie narzędzie do tego, czy nie. My tak naprawdę przez budowanie świadomości i
27:51
Speaker A
odpowiedzialności myślę, że pomagamy ludziom wdrażać się w wykorzystywanie tych narzędzi, bo wiedzą, że jest to, że jest to sprawdzone, jest to zweryfikowane.
28:01
Speaker A
I ja tak samo patrzę na to, jaka jest rola prawnika. Prawnik co do zasady powinien pomagać biznesowi, a nie go blokować. To, że mamy pewne wytyczne, to tak naprawdę pomaga ci działać bezpiecznie i odblokowuje ci pewne możliwości. Tam, gdzie jest potrzebne,
28:16
Speaker A
nie wiem, nałożenie dodatkowych ograniczeń, to tak naprawdę te ograniczenia są dla ciebie dobre, bo w dłuższej perspektywie one ci pomogą zabezpieczyć się przed ryzykiem, które inaczej może być szkodliwe albo bardzo krytyczne dla twojego biznesu.
28:33
Speaker A
Jasne, jasne. I Paulina. Pytanie trzecie, które mamy przygotowane i właśnie dotyczy czegoś, co co poruszyłeś na samym wstępie i mówiłem, że parkujemy temat, no to teraz do niego wracamy.
28:46
Speaker A
Pytanie dotyczące ochrony własności intelektualnej czy praw do danego tworu wygenerowanego przez AI. Wygenerowałam, wygenerowałem z AI logo dla mojej nowej marki. Na co zwrócić uwagę, abym mógł wykorzystać je bezpiecznie? właśnie jako to logo mojej firmy, na przykład na
29:03
Speaker A
stronie internetowej w mediach społecznościowych. Tu znowu myślę, że to jest tak jak rozmawialiśmy, to wszystko są przyczynki do dyskusji, bo tu jest to jest bardzo bardzo szeroki temat. Ale zacznijmy od pewnych podstaw. Żebyśmy mogli mówić o czymś, co jest naszym tworem, to musi
29:16
Speaker A
musi tam być element twórcze twórcze twórczości człowieka. Tak do tej pory definiowane są utwory, które podlegają ochronie prawnoj. Żebyśmy mogli mówić o czymkolwiek, co jest chronione i żeby było to utworem, to też musi mieć jakiś element wyróżniający.
29:31
Speaker A
Jeśli zaczniemy patrzeć od całości, od sposobu przygotowania promptu, od sposobu podejścia do całego, do sposobu generowania grafik promptów, whatever, to jak rozmawiałyśmy o tym przykładzie z Agatą w naszym webinarze, tam była w naszym naszej lekcji była ta był to
29:48
Speaker A
przykład logo nie wiem, firmy budowlanej. Jeśli powiemy przygotuj mi logo firmy budowlanej, to nie jest to zbyt precyzyjne i nie ma tam tak naprawdę zbyt nasze zbyt dużo naszego [odchrząknięcie] inputu własnego. Ale jeśli zaczniemy od tego, że takie
30:01
Speaker A
kolory, takie kształty, zależy mi na takim look and feel, chciałbym, żeby ono miało, nie wiem, taki element graficzny połączony w takiej stylistyce, a tu w ogóle sobie coś tam naszkicowałem i niech to będzie mój punkt wyjścia. Im więcej jest naszego elementu twórczego,
30:16
Speaker A
tym bardziej jest to, tym więcej jest możliwości, że to jest twórcze i że jest to nie będzie to powielane. Jak już mamy pewien projekt, to co my polecamy zawsze, to zrobienie reverse search, czyli wrzucamy taki obrazek wygenerowany, takie logo i sprawdzamy,
30:34
Speaker A
czy ono już gdziekolwiek istnieje w takiej formie i co jest najbliższe do tego. To nam pozwoli zobaczyć, czy to nie jest, czy jakby czy nie ma już czegoś takiego albo bardzo podobnego na rynku. To jest pierwsze pierwsza opcja.
30:45
Speaker A
Ja też mam do tego kolejną polecajkę tip. Dlaczego nie nie potraktować tego jako bazy i punktu wyjścia? Niech AI stworzy mi coś, co ja bym jakby niech to będzie, nie wiem, pierwszy draft, a potem ja jako twórca w tym w tym
31:02
Speaker A
etapie dodam element swój. Nie wiem, może z moim grafikiem, którego tutaj sobie zatrudnię albo nie wiem, samemu, whatever, w zależności od talentów. Ja raczej z grafikiem. yyy nanieśmy swoje zmiany, żeby zminimalizować ryzyko.
31:18
Speaker A
To jest dobra wskazówka. Ja myślę w ogóle, że proces odwróconego promptowania albo wyszukiwania właśnie w ten sposób pokazywaliśmy w programie troszeczkę z innej perspektywy, ale nie z tej, o której ty mówisz, więc to też warto sobie zapisać właśnie jako tip,
31:32
Speaker A
czy czy coś podobnego zostało wygenerowane, ale myślę, że najbezpieczniej będziemy się czuli w sytuacji, w której coś, ten swój sznyt, jakąś zmianę dodamy do tego tworu wygarnowanego przez y AI. I myślę, że to jest dobra porada, z którą warto warto
31:47
Speaker A
zostać. Ja myślę, że to też znowu wracając do tego, w jaki sposób omawialiśmy te zagadnienia w pierwszym tygodniu, rozumiem, że to samo mogłoby dotyczyć tak naprawdę grafiki, wideo, każdego innego tworu, nie tylko logotypu.
32:02
Speaker A
To jest narzędzie. Again, zaczynamy od podstaw. Jakby zawsze wracam do tych jakby do tego całego do bazy. Bazą jest to, że narzędzia jej są narzędziami w naszych rękach, więc czy to będzie logotyp, czy to będzie grafika, czy to
32:16
Speaker A
będzie cokolwiek, uważam, że to jest dobry punkt wyjścia. Czy jak dostaniesz treść maila, którą wy generujecie jej, wysyłasz ją zawsze dokładnie tak samo jak wyszła, czy ja na przykład ja zazwyczaj traktuję ją jako punkt wyjścia. Dobra, zależy jaki. Okej, tu
32:29
Speaker A
bije się, zależy który. To jest dobre pytanie, ale zazwyczaj takosuj dostosowujesz do coś pod siebie jeszcze w jakiś sposób swój ton. Jakby ja uważam, że już przy promptowaniu wystarczająco długo jesteś w stanie naprawdę dobry draft wygenerować. Ale hm, czy ma moje
32:45
Speaker A
poczucie humoru? Nie zawsze. Dobra, poczucie humoru dużo sobie pozwoliłam, ale ale tak zazwyczaj dodaję coś od siebie, co jest moje, żeby żeby to było tak naprawdę po mojemu i uważam, że to jest możemy to prosto przełożyć właśnie na
32:58
Speaker A
ten, na ten aspekt, nawet o dziwoprawny, którym mógłby być wyzwanie. Paulina, ja na tym etapie yyy jeżeli chodzi o tą pulę pytań y dość szerokich yyy w których chcieliśmy przeskoczyć właśnie przez różne zagadnienia i zebrać je w jednym yyy miejscu, które zadają nam y
33:16
Speaker A
uczestnicy. Yyy tą pulę wyczerpałem. Wiem, że już zasięgnęliśmy trochę wiedzy z tygodnia trzeciego właśnie dotyczącej tej agentowości, agentów sprawdzających agentów przed wysłaniem tej wiadomości lub postawieniem człowieka, który finalnie decyduje, czy ta propozycja wiadomości w ramach na przykład chatbota
33:36
Speaker A
obsługującego klienta może zostać wysłana czy nie. Będziemy do tego jeszcze wracać właśnie w tym tygodniu trzecim. Kwestia shadow AI, tworzenia tych regulacji polityk, które mogą zachęcać wręcz do korzystania z AI, w szczególności tych sceptyków. lub jeżeli jesteśmy liderem AI i chcemy przekonać
33:53
Speaker A
swojego pracodawcę, swojego przełożonego, żebyśmy z tego AI korzystali i pokazanie, że możemy to robić bezpiecznie, mając konkretne zasady, regulamin, regulacje jak z nich korzystać i w ten sposób przekonać, że tego AI workshlopu nie będzie lub nie będzie ryzyk związanych z wyciekiem
34:13
Speaker A
danych, które tam wprowadzamy i i złamaniem jakiegoś prawa. RODO, nie będę wchodził w szczegóły, bo jeszcze się o to potknę. No to to też będzie aspekt poruszany w tygodniu piątym, więc zrobiliśmy dobrą pętlę przez całe 5 tygodni programu. Ja na pewno zostaję
34:30
Speaker A
sobie z zapisanym hasłem human delete, które na pewno będziemy odmieniali jeszcze przez kilka przypadków wśród grona liderów AI, którymi są lub będą nasi uczestnicy. I bardzo ci dziękuję za tą część spotkania. Dziękuję ci bardzo i dziękuję wam wszystkim serdecznie
34:51
Speaker A
i z naszej strony to jest koniec tej pierwszej części. My teraz potrzebujemy dosłownie kilku sekund i za chwilę przed nami Sebastian Kondradzi, którego również poznaliście w pierwszym tygodniu umiejętności jutra, ale poznaliście go z perspektywy tego, jak możecie już wykorzystywać Bielik.
35:13
Speaker A
natomiast my zajrzymy za kulisy jego powstawania, dlatego zostańcie z nami. Jesteśmy ponownie. Witamy was bardzo, bardzo serdecznie. Razem ze mną jest nasz kolejny gość dzisiejszego spotkania. Jak wspomniałem Sebastian Kondradzi, jeden z twórców Bieligi i w naszej nomenklaturze my sobie utarliśmy,
36:28
Speaker A
ojciec założyciel Bielica i już taka tradycja, że możemy cię gościć, za co bardzo dziękujemy w programie. Witamy cię serdecznie.
36:36
Speaker A
Dzień dobry. Nie będę dyskutował może z tym założycielem, ale okej, niech będzie. Zostańmy, zostańmy przy tym y określeniu. Sebastian, jest z nami ponad 11000 ludzi. Taką informację tutaj dostałem od y zespołu. Niektórzy nie dowierzają, że jesteśmy na żywo, ale
36:53
Speaker A
odpuszczę inauguracyjne wypisywanie nasz w miast. Nie musimy tego robić. Yyy, przechodzimy właśnie do tej części yyy naszej rozmowy, w której w sumie ja zawsze z chęcią yyy zerkam zarówno w postępy, jak i w tą historię yyy która miała miejsce yyy już kilka
37:11
Speaker A
lat temu yyy kiedy ten pomysł na stworzenie polskiego y modelu językowego powstał. I właśnie takie moje pierwsze pytanie, skąd to się wszystko wzięło?
37:20
Speaker A
jak to się zaczęło, że ktoś w Polsce wpadł na pomysł, musimy albo warto mieć polski własny model językowy.
37:28
Speaker A
Powiedziałbym kilka wektorów, które zdecydowało, że że ten Bielik powstał, który jeszcze wtedy nie nazywał się Bielik.
37:35
Speaker A
Pierwsza rzecz, my rzeczywiście wdrażaliśmy jeszcze sztuczną inteligencję przed dużymi modelami językowymi. Strasznie męczyliśmy się, zwłaszcza w w organizacjach takich regulowanych, w bankach na przykład, że trzeba było te dane anotować, nie można było wykorzystywać żadnej chmury zewnętrznych różnych usług. To było
37:54
Speaker A
ciężkie. I nagle pojawia się duży model językowy, gdzie możemy wiele rzeczy przyspieszyć, gdzie wiele procesów możemy zrobić bez tej anotacji, bez tego klasycznego machine learningu, ale było jedno, ale. No właśnie, bankowość, tajemnica bankowa i i tutaj był ten
38:11
Speaker A
główny problem. Yyy, no i wtedy to był ta pierwsza myśl, żeby w tej branży takiej, która obsługuje organizacje regulowane, spróbować stworzyć duży model językowy. Następną rzeczą było właśnie y też trochę mało projektów było wcześniej takich otwarto, nie powiem
38:28
Speaker A
otwarto-Źródłowych, bo tutaj mamy w dużych modelach językowych bardziej otwarto wagowe. Yyy, ale rzeczywiście brakowało takiego społeczności, gdzie razem usiądziemy i zaczniemy coś robić, kodować trenować zbierać klasyfikować dane. Więc trochę widzieliśmy, że tu można by było coś coś zrobić. No i
38:49
Speaker A
połączylibym, powiedziałbym, te kropki. że okej, no może spróbujmy zrobić polski model językowy. I kiedy pojawił się model Bloom? To była taka europejska odpowiedź. europejska odpowiedź na modele Open AI i on w 2022 roku pojawił się w lipcu to nagle zauważyliśmy, że to jest
39:12
Speaker A
otwartowagowy model europejski, ale nie ma języka polskiego, nie ma języka włoskiego, nie ma języka niemieckiego, więc stwierdziliśmy, a może by tak, a może by tak właśnie w tej społeczności otwartej ten model spolonizować czy dodać język polski.
39:29
Speaker A
Okazało się, że to jest trudniejsze, że może łatwiejsze jest właśnie stworzyć polski model. No i tak się zaczęło wszystko. I tak się zaczęło. I ja teraz nie chciałbym wybiegać w przyszłość, bo już wiemy, że to nie jest tylko polski
39:43
Speaker A
model i troszkę teraz uprzedzę fakty, ale tak się do tego odnosimy, nie tylko polski, bo od grudnia 2025 roku chyba w ramach Bilika zrobiliście też znaczący postęp.
39:55
Speaker A
Tak. Yyy, zrobiliśmy rzeczywiście to taką taki 31 grudnia. Yyy, jest, jest 31 grudnia. Dobrze. Tak jest, [śmiech] jest 31 grud.
40:05
Speaker A
Czekaj, bo to ja zawsze na kosteczkach zgadza się. Właśnie 31 grudnia stwierdziliśmy, że opublikujemy model y Bielik. Trochę go nazywamy trochę euro, ponieważ oprócz języka polskiego otrzymał ponad 30 języków naturalnych.
40:21
Speaker A
I dlaczego? Yyy, no hm, po pierwsze my mamy dosyć mało danych yyy w Europie i w Polsce, więc my na te dane naprawdę huchamy, dmuchamy, y mocno je klasyfikujemy, oczyszczamy, żeby żeby było ich jak najwięcej, mimo że ich jest
40:41
Speaker A
mało. To też jest druga rzecz, że ponieważ my cały czas chcemy, żeby ten model był mały, czyli 11 miliardów parametrów, żeby zmieścił się na mały serwer, dość małą infrastrukturę, więc te 11 miliardów parametrów jest dla nas bardzo ważne, więc staramy się tam
41:00
Speaker A
umieścić jak najwięcej takich wysokiej jakości danych i i stąd jak sobie pomyśleliśmy, dobra, mamy te potoki y stworzone, jeśli chodzi o dane dla języka polskiego, to dlaczego by nie spróbować w innych językach i dokładać tych tych tych języków. No i
41:22
Speaker A
okazało się, że rzeczywiście ten eksperyment udał się. Mamy wysokie noty, jeśli chodzi, uwaga, tu od razu powiem o model językowy w tej klasie, prawda?
41:33
Speaker A
Czyli nie będziemy teraz konkurować z jakimiś zamkniętymi modelami dużymi, ogromnymi, ale w tej klasie, który model 11 miliardów parametrów można pobrać na swój komputer, to mamy bardzo wysokie wyniki, choćby na takim benchmarku Euroeval, gdzie można sprawdzić sobie modele, jak z różnymi językami
41:52
Speaker A
europejskimi sobie radzą. To działanie też w innym języku pokazaliśmy też w lekcji. Z tego co pamiętam, ten przykład jeden dotyczył któregoś z dokumentów medycznych chyba w języku włoskim. y, który był tłumaczony, więc w sumie już uczestnicy mieli próbkę
42:06
Speaker A
y działań tego modelu w tym zakresie. Tak. To to jest właśnie fajne, że że można sobie te dania dane medyczne, listy miłosne, nie wiem czy ktoś jeszcze pisze listy miłosne tego nie wiem, możemy zapytać o to na czacie, chociaż nie umiem niestety
42:20
Speaker A
stworzyć ankiety, żeby to sprawdzić. Wrócimy do tego tematu na Discordzie, tak? A, ale można rzeczywiście sobie tłumaczyć, można sobie streszczać te dokumenty, no właśnie tam, gdzie jest duża wrażliwość danych. albo jest duża wolumetria, jest dużo tych danych. To
42:35
Speaker A
teraz Sebastian, wrócimy trochę jeszcze do tych kulis, dlatego że nie nie bez powodu powiedziałem o tych kolejnych językach, które były dodawane i nawiązaliśmy do trenowania modelu. Ja myślę, że to jest bardzo ciekawy aspekt z perspektywy pracy z AI, bo jak
42:54
Speaker A
myślę sobie o pierwszym tygodniu programu, o tym w jaki sposób chcieliśmy nauczyć tych podstaw pracy z AI, bardzo dużo mówimy o kontekście, o dodawaniu informacji, które mogą sprawić, żeby modele dawały nam dużo lepsze odpowiedzi osadzone w naszym kontekście, żeby
43:08
Speaker A
uciekać od tego bajasu, tego ograniczenia, tego czym model jest wytrenowany. I teraz może dałbyś radę w jakimś skrócie powiedzieć nam czym tak naprawdę jest trenowanie modelu, jak ten proces wygląda. To etykietowanie danych to brzmi jak coś bardzo skomplikowanego, pewnie
43:30
Speaker A
kosztownego. Jak sobie z tym poradziliście? Mhm. Tego procesu rzeczywiście proces trenowania dużego modelu językowego jest tam kilka etapów. Pierwszy etap jest dość prosty. Trzeba mieć super komputer i następnie dajemy mu do czytania bardzo dużo tekstów. Tak, oczywiście już w tym
43:49
Speaker A
etapie my musimy dbać o jakość tych tekstów, a przede wszystkim o dobre zróżnicowanie, zwłaszcza w takich małych modelach jak nasz, bo w dużych modelach dajmy wszystko co mamy i i już.
44:02
Speaker A
Natomiast u nas chcemy właśnie, że jeśli damy mu za dużo tekstów do czytania prawnych, to żeby nie było tego stylu takiego zbyt formalnego, z drugiej strony zbyt potocznych. Więc to to jest bardzo ważne, żeby zróżnicować ten pierwszy zestaw,
44:17
Speaker A
gdzie dajemy mu czytać. Bardzo upraszczam od razu, ale to bardzo dobrze to dajemy mu czytać dużo tekstów i on sobie czyta i my tworzymy model bazowy. Ten model bazowy jest takim modelem, który jeszcze to nie jest te właśnie model,
44:35
Speaker A
który używamy podczas jakiegoś czatowania. Ten model bardziej nam przewiduje następne słowo, znów upraszczam, bo tak naprawdę to tam token i i i tu byśmy musieli wejść trochę głębiej. Czyli daje dwa słowa. Adam Mickiewicz to i on właśnie potrafi te następne słowo. I tak
44:55
Speaker A
sobie po kolei możemy generować teksty. Ten model bazowy jeszcze ma taką strukturę języka całą, ale jeszcze nie ma tych stolności, których my widzimy podczas takiego czatowania czy podczas jakiś już zadań bardzo mocno specjalizowanych.
45:11
Speaker A
I dopiero po tym etapie mamy już etap, w którym powinniśmy mu dawać tak zwane instrukcje albo właśnie dialogi. I to trochę przypomina jak w szkołach mieliśmy ćwiczenia z kluczem. Tak, z kluczem. To chyba z kluczemy tak, czyli mieliśmy jakieś zadanie
45:30
Speaker A
i do tego mieliśmy odpowiedź i teraz mogliśmy sobie zobaczyć, a bardzo często też mieliśmy dochodzenie też do tej odpowiedzi, tak, że tu trzeba coś zrobić, żeby coś i i tak dalej. I właśnie w tym procesie drugim, żeby już
45:43
Speaker A
dostać taki model instrukcyjno właśnie czatowy, w którym możemy rozmawiać i dawać mu jakieś zadania, my musimy mieć takich dużo zadań z kluczem.
45:53
Speaker A
No i tu zaczyna właśnie się ten problem. Oczywiście to muszą być takie liczby, że ta anotacja byłaby bardzo ciężka. To znaczy świetnie mieć duży zespół, byśmy mogli anotować. Tu szukamy różnych metod. Na przykład yyy różne izby zawodowe dają zadania z kluczem, czy prawnicy,
46:12
Speaker A
czy lekarze. Możemy sobie zobaczyć różne zadania, które są yyy na stronach bardzo często też też naszych rządowych, więc nie mamy tu problemu z sprawami autorskimi, żeby je wykorzystać. No i tak po kolei możemy sobie różne zestawy danych, które służą nam ludziom bardzo
46:33
Speaker A
często do szkolenia, egzaminacji nas i tak dalej, możemy wykorzystać właśnie do stworzenia tych instrukcji, które będą w tym drugim etapie. na to, że mieliście jakąś gwarancję wyższej jakości tych materiałów, które wprowadzaliście, skoro były w ten sposób zbierane. No tu tak
46:50
Speaker A
dokładnie mamy tą tą trochę przyjemność, że z jednej strony mamy społeczność, ale to od razu powiem, że mimo, że w naszej społeczności teraz jest ponad 5000 osób, to seie wyobraźmy, że tych instrukcji my potrzebujemy w milionach, więc to to nie jest do końca, ale ta
47:10
Speaker A
społeczność może generować różne skrypty, może generować takim klasycznym machine learningiem różne zestawy danych. może właśnie brać tekst i takimi modelami, bym powiedział, językowymi, stylometrycznymi wykrywać różne w zdaniu na przykład różne części i dawać takie zadanie, na przykład to jest nie wiem
47:35
Speaker A
zdanie ala kota i powiedz kto tam czy kot to jest czasownik, rzeczownik i se możemy jakimiś z innymi metodami przetwarzania języka naturalnego takie instrukcje wytworzyć. Więc ta społeczność daje nam pewne właśnie pewne takie mechanizmy, dzięki którym możemy troszeczkę przyspieszyć, ale jednak taka
47:56
Speaker A
ręczna anotacja to też bardzo ciężka jest, ale też czasami po nią sięgamy. No i później już są etapy takie optymalizacyjne, też różne inne, że czasami nadajemy im na przykład takie elementy wnioskowania, więc też tam troszeczkę trzeba już nieraz zrobić
48:10
Speaker A
takie walidatory, które potrafią sobie rozwiązywać niektóre rzeczy i tak dalej, i tak dalej. I tak sobie trenujemy. Co ważne jest, my w każdym takiego procesie treningu musimy cały czas walidować, co tam wychodzi, że tak powiem, z z tego
48:26
Speaker A
naszego treningu, jaki jest model też uczestnicy czy osoby korzystające, czy to jest już późniejszy etap, ten, który widzieliśmy w lekcji na przykład w kontekście feedbackowania tych odpowiedzi, to już jest później.
48:39
Speaker A
To już jest później. też dajemy takie narzędzia, w którym właśnie można jakiś ocenić styl i właśnie nam ten feedback i my później też sobie to analizujemy. I znów jeśli patrzymy, że w jakimś obszarze gorzej bielik występuje, to wtedy możemy ten obszar właśnie
48:57
Speaker A
troszeczkę bardziej ludzko zaopiekować. Więc jeśli patrzymy przysłowia polskie, chociaż takie zadania rzadko się spotykają, ale byłoby gdzieś jakieś problemy, no to wzięlibyśmy wielką księgę przysłów polskich i odpowiednio zrobili odpowiednie zestawy danych.
49:15
Speaker A
Patrzmy, że to jest wielka trudność, bo ja mówię, weźmy sobie księgę przysłów polskich, ale prawa autorskie, więc to nie jest tak, weźmy sobie. I to jest właśnie ta trudność, którą mamy, że po pierwsze muszą być te dane, po
49:29
Speaker A
drugie my musimy je odpowiednio przygotować, a po trzecie jeszcze tymi pokrętełkami różnymi na tym super komputerze zrobić, żeby cały czas ten ten proces był jak najlepszy. I właśnie myśmy dla języka polskiego zrobili taki, to się ładnie nazywa, potok
49:44
Speaker A
przygotowania danych, kuracji danych i tak dalej, i tak dalej. I teraz popatrzyliśmy sobie, a może tak, zobaczmy język angielski, francuski, niemiecki i tak dalej. I to zadziałało.
49:55
Speaker A
Jasne. To brzmi naprawdę jakby w takim dużym uproszczeniu jakby było łatwym procesem. A z drugiej strony jakby jak mówisz o rozmiarze społeczności, pracy, etapach i tych wyzwaniach, które były, to na pewno warto docenić to, ile włożyliście w to wkładu jako społeczność
50:14
Speaker A
też Bielika. Ja myślę, że też bardzo ważnym elementem jest, że naszym wynikiem pracy oczywiście jest bielik albo sjka, bo też mamy inne modele, ale najważniejszym elementem to jest budowanie wiedzy tu.
50:27
Speaker A
Więc teraz łatwo mi przychodzi opowiadać o o tym całym, bym powiedział, o tym całym ciągu zadań i różnych innych, ale musieliśmy to wypracować i to profesor Andrzej Dragan powiedział, nie ma lepszego sposobu na budowanie wiedzy niż stworzenie czegoś własnoręcznie. I tak
50:45
Speaker A
samo jak trochę w tych lekcjach, kiedy ja namawiam, żeby ten model językowy uruchomić se na własnym komputerze, zainstalować LM Studio i tak dalej, i tak dalej, to pokazuje, że my coś robimy własnoręcznie i później jak już będziemy w naszych firmach wdrażać produkcyjnie i
51:03
Speaker A
być może już nie my będziemy realizować, że ktoś inny jakiś postawi kontener, zakupi infrastrukturę, to my będziemy potrafili lepiej to zrozumieć. Będziemy mogli operować tym samym językiem, kiedy mówimy parametry, kiedy mówimy jakieś okno kontekstowe. My wtedy wiemy, aha,
51:19
Speaker A
okno kontekstowe, tak, było dużo, mój komputer mało nie odfrunął, prawda? To już wiem o tym, że tu jest jakiś jakiś problem, że te okno kontekstowe potrzebuje jednak więcej mocy. I to jest bardzo ważny element, ta wiedza, którą tworzymy i którą możemy się dzielić.
51:35
Speaker A
To teraz Sebastian, jaka wizja końca z perspektywy tego początkowego procesu wam przyświecała? Yyy, chodzi mi o to, że ogrom pracy za wami. Yyy, i myślę, że często też spotykacie się z takimi pytaniami, które też przewijały się wśród naszej społeczności. Yyy, i możemy
51:52
Speaker A
teraz to spróbować yyy zdekodować, odpowiedzieć w jakiś sposób, żeby wyjaśnić co stoi za Bielikiem, jaka jaka idea, jaki jest sens tego, że to tworzycie. Y, bo skoro na rynku pracy no ktoś może zadać sobie pytanie, mamy działające modele Chat GPT, Gemini,
52:09
Speaker A
cloud, które są, wydaje się ogólnodostępne i z większością rodzajów zadań jako tako sobie radzą, nawet jeżeli nie jesteśmy geniuszami promptowania.
52:22
Speaker A
No to dlaczego potrzebujemy polskiego modelu? Dlaczego potrzebujemy Bielika i do jakich zadań to polskie rozwiązanie zostało stworzone? ta wizja właśnie y tej grupy docelowej, być może tego Bielika, tu trzeba, ja myślę, że trochę takie dwie perspektywy. Pierwsza w ogóle
52:40
Speaker A
trzeba powiedzieć czym jest Bielik, a czym jest na przykład Czat GPT czy całe w ogóle AI Studio na przykład. Yyy, to jest cały system tam, czyli tam jest system, który potrafi pobrać coś z internetu. Ma wiele modeli też bardzo często, że on potrafi w locie
52:57
Speaker A
nam yyy po polecić na przykład model wnioskujący, wnioskujący, bo widzi jaki typ zadania jest na przykład. Więc to jest, ja bym powiedział, cały samochód, tak? A Bielik to jest jednak silnik.
53:10
Speaker A
trzeba go obudować, ale naprawdę możemy go obudować na własnych zasadach do naszych bardzo specjalizowanych zadań.
53:18
Speaker A
Możemy go dostroić do naszych zadań. Więc jeśli mamy gdzieś w naszej organizacji, nie wiem, jakąś ontologię, kategorię i tak dalej, który nie zna świat, bo są bardzo tajne na przykład albo są naszym takim głównym jakąś usługą, no no to Bielik jest
53:35
Speaker A
fantastyczny. możemy go dostroić, czyli jeszcze douczać, możemy go obudować dowolnie, możemy na własnej infrastrukturze uruchomić, więc możemy obniżyć koszty, bo pamiętajmy, jak my używamy dużych modeli językowych i płacimy tam do $ar na przykład miesięcznie czy innych, to jak nasz
53:52
Speaker A
system korzysta z tego dużego modelu, czyli jest to API, to my rozliczamy się per token, czyli i to zmienia i teraz wyobraźmy sobie, wyobraźmy sobie mamy świetne, świetną firmę, 100 pracowników, dużo raportów się okazuje na przykład niech to będzie jakaś firma
54:07
Speaker A
właśnie, która prowadzi taki mocny research i nagle y 100 200 stron przez każdego pracownika codziennie jest streszczane, tłumaczone, to liczba tokenów jest przeogromna. Już się mówi w branży o tak zwanych paragonach grozy, czyli że tyle tokenów się tutaj przepali, że tak powiem. A to
54:28
Speaker A
warto to podkreślać z perspektywy też przedsiębiorców, którzy biorą udział w programie, bo myślę, że to jest ważny element, w szczególności jak wejdziemy w ten tydzień trzeci automatyzacji, czyli gdzieś gdzie już będziemy tworzyć bardziej autonomiczne rozwiązania, proste automatyzacje, gdzie te tokeny
54:43
Speaker A
mogą nam uciekać i generować ogromne koszty. Tak. I teraz pierwszy przykład to był taki transportowy i taka płaszczyzna właśnie, że silnik a samochód trochę coś innego. A druga yyy no można powiedzieć, no jeśli jest właśnie modele zamknięte, to po co nam bielik? No jeśli jest Audi
54:59
Speaker A
i Mercedes, to po co nam koparka czy wózek widłowy? Mhm. Y no przecież możemy sobie tym taką, nie wiem, to będzie taka trochę lokacja produktu Q7 na przykład, spokojnie dwa worki cementu przewieźć, tak? Albo betoniareczkę sobie tam podłączyć. Koszt
55:16
Speaker A
tego będzie przeogromny i tak dalej, i tak dalej. Tak samo właśnie w Bieliku i ja czasami też wchodzę na Discorda umiejętności jutra i nieraz tam widzę takie przejawki, że ktoś mówi: "A jak masz dobrego kompa, to może nie zaczynaj
55:30
Speaker A
od bielika, a zacznij od na przykład gżemy czy gemy." Ja zawsze się pytam, bez podania zadania to jest naprawdę tak jak ja bym powiedział: "O, masz pizzerię". No to po co wchodzisz na przykład w jakieś skutery czy inne środki, które fajnie tą
55:46
Speaker A
pizzę nam dowożą, wejść od razu w Q7? No to wyobraźmy sobie jaki to będzie biznesowy rachunek. I ja nawet y powiedziałbym tak, nie wiem, nie liczyłem nigdy dokładnie, ale myślę, że w moich projektach to w 20 30% jest to
55:59
Speaker A
Bielik, a resztę są modele zamknięte, ale bardzo często je łączę w całe łańcuchy, kiedy na przykład Bielik coś anonimizuje i i idzie to na przykład do modelu wnioskującego. Albo na przykład bielik robi bardzo proste strukturyzacje na przykład dużej wolumetrii. W
56:14
Speaker A
e-comersie na przykład tych produktów jest dużo, a na przykład już wygładzanie opisu robi już jakiś inny model. analizę danych klientów. Robi to bardziej Bielich, bo mamy RODO, mamy inne obostrzenia. Nie muszę wysyłać do chmury wszystkiego, co się pojawia na przykład
56:29
Speaker A
w moim mailu. Mogą różne rzeczy się pojawić. U mail, tylko zostawiasz je po prostu u siebie i one nigdzie nie wychodzą poza ciebie, twoją organizację.
56:36
Speaker A
Więc nie ma, który model jest lepszy czy gorszy, bo to są inne klasy modeli i bez podania zadania nie da się to powiedzieć, który jest lepszy. I właśnie tak ostatnio kiedyś na Discordzie ktoś właśnie powiedział, że odinstaluj Bielika już od razu przejdź, jak masz
56:51
Speaker A
dobry komputer właśnie na gemę. I ja na przykład u siebie uwielbiam w ogóle Gemma jest jednym moim lepszych modeli takich lokalnych i wielojęzykowych, ale no niestety czasami mój komputer lekko odlatuje, bo ona już ma 30 miliardów parametrów. To znaczy są też mniejsze,
57:10
Speaker A
ale lubię tą 30 powyżej. yyy to wtedy komputer mi odlatuje. Bielik przy mojej infrastrukturze, że tak powiem, radzi sobie świetnie. Więc mówię, każde zadanie jest inne. Do każdego zadania możemy użyć jednego modelu specjalizowanego albo kilku. No i to
57:29
Speaker A
jest tak, czyli rozbijamy jakiś proces. My to też staraliśmy się chyba pokazać w programie, pamiętam w pierwszym tygodniu, gdzie pokazywaliśmy to na mikroprocesach, małych zadaniach, ale każdy duży proces, na przykład z perspektywy tych branż, o których mówiłeś, bankowości, ochrony zdrowia,
57:42
Speaker A
jeżeli rozłożymy na małe części duży proces, to wtedy wchodzimy właśnie w tą umiejętność wybierania technologii rozwiązania adekwatnej do zadania, z którym się mierzymy. No bo na koniec dnia musi się zgadzać ROI.
57:56
Speaker A
nie chcemy mieć tych paragonów w cudzysłowie grozy dotyczących zużycia tokenu. Więc dla niektórych biznesów i dla niektórych zadań to będzie ten model który będzie korzystniejszy. Na przykład tak jest taka strona open router, która po prostu są wszystkie modele, które są
58:11
Speaker A
dostępne na świecie, zamknięte, otwarte, małe, duże i tam w jednym miejscu można sobie zobaczyć właśnie cenniki i zobaczyć, że nieraz różnica jest stukrotna na przykład. I teraz wyobraźmy sobie jak tych produktów albo albo rekordów naszych klientów w bazie danych
58:30
Speaker A
mamy w setkach tysięcy. Jaka to jest różnica przy przetwarzaniu, prawda? Więc to jest bardzo ważny element, żeby tak jak w motoryzacji czy też w innych po prostu branżach naszych, my dobieramy narzędzie do naszego zadania i też staramy się po
58:50
Speaker A
prostu, żeby ten koszt był jak najmniejszy, prawda? No mogę dostarczać Q7 najnowszą. Nie wiem czemu się tej Q7 musimy zmniejszyć zmienić, ale ja nie znam innego samochodu.
59:01
Speaker A
Ale nie jesteśmy sponsorowani. Spokojnie. Tak. yyy możemy dowozić pizzę, czy możemy właśnie yyy pracowników do pracy, czy na budowę i tak dalej, ale są lepsze i biznesowo bardziej y dobrane środki.
59:13
Speaker A
Sebastian, to trochę podsumowując ten aspekt, gdybyśmy mieli myśleć o Bieliku jako idealnym modelu do zadań typu i do branż typu, no to na pewno z perspektywy tej anonimizacji tego, że możemy ten model ze względu na ilość parametrów osadzić lokalnie
59:30
Speaker A
do do przetwarzania naszych własnych danych, których ze względu na przykład narodu nie chcemy, żeby wyciekały poza naszą organizację. Co byś wskazał?
59:37
Speaker A
Takich kilka rzeczy, żeby z nami zostały. Ja myślę, że to są trzy elementy właśnie, które trzeba patrzeć. Pierwsze to wrażliwość danych i ta ochrona w ogóle. Y to jest to jest pierwsza rzecz.
59:48
Speaker A
Druga to jest volumetria, czyli rzeczywiście jak mamy milionu, milion różnych rekordów, gigabajty tekstów, bo na przykład bielikiem albo modelami takim, tak samo małymi, ale dedykowanymi na przykład możemy analizować logi serwerów i sprawdzać różne rzeczy, czy tam nie było
60:05
Speaker A
wycieku na przykład, albo czy tam strukturyzować je, żeby inne algorytmy machine machine learningowe coś sobie realizowały. Więc wolumetria to jest druga rzecz, żeby obniżać ten ten koszt.
60:18
Speaker A
I trzecia rzecz to jest przewaga konkurencyjna. To znaczy jeśli wszyscy będziemy tych samych modeli używać, to jak zbudujemy usługę, która będzie jakąś przewagę, no tak naprawdę każdy będzie mógł następne konto sobie założyć gdzieś w modeli, modelach zamkniętych. Bielik
60:35
Speaker A
dostrojony, na przykład Bielik medycznie jest, bym powiedział, po takim liceum medycznym tak? No i teraz są już właśnie startupy w Polsce, którzy wzięli tego Bielika, mieli dużo legalnych tekstów medycznych i po prostu dostroili i zbudowali na przykład rejestratora,
60:57
Speaker A
który może służyć gdzieś w szpitalu lub w przychodni i wtedy bardzo dobrze strukturyzować już ten tekst medyczny. I to jest właśnie ta przewaga, którą ktoś osiągnął i zbudował sobie takiego yyy bielika już nie, ale jakiegoś jasne własny model, czyli jakby tą
61:14
Speaker A
karoserię, za tą karoserię, jak mówisz do tej analogii motoryzacyjnej, on już stworzył sam, czyli wy dostarczyliście silnik, natomiast w rękach klienta w jakiś sposób, no i podwykonawców, którzy mu towarzyszą, jest zbudowanie tej karoserii, żeby on właściwie odpowiadał na zadanie, do którego jest dedykowany
61:31
Speaker A
i wtedy znów te motoryzacja, ale już nie Q7. Si może z Mercedesa zrobić Maybacha.
61:37
Speaker A
Tak Maybach niech będzie, niech będzie. To trochę powiązane z ojcem dyrektorem, z założycielem. Y to Sebastian, jakby z perspektywy klientów branż, mając na uwadze, którą już mamy godzinę i ten czas niebywale szybko nam mija, dla uczestników umiejętności jutra. yyy w jaki sposób y możesz myśleć
62:00
Speaker A
też z perspektywy mojej yyy i do jakich zadań warto, żebyśmy tego Bielika yyy testowali albo gdzie może dla nas stanowić wartość? Czy to jest raczej właśnie wartość bardziej dla biznesu, yyy, czyli nie ludzi pracujących w dużych organizacjach jeszcze na tym
62:15
Speaker A
etapie, a być może dla przedsiębiorców małych, średnich. Ja uważam, że jednak rzeczywiście Bielik jest takim B2B, jednak biznesowym, biznesowym albo biurowym, bo bo to też może być w sektorze publicznym na przykład, więc myślę, że bardziej jest biznesowy.
62:32
Speaker A
Natomiast świetny jest bielik do takiej indywidualnej nauki, bo możemy go uruchomić właśnie na swoim komputerze i wieczorami trochę go pomęczyć. bawić się parametrami, to co pokazywałeś, bawić się temperaturą, żeby zobaczyć jak ten model, nie wiem czy mnie nikt nie
62:46
Speaker A
zlinczuje, jest kreatywny w odpowiedziach, które daje. Nie chciałbym tego słowa używać, ale najprościej jest tak to określić.
62:53
Speaker A
Dokładnie. Więc pierwsza to jest, żeby budować wiedzę, a później już nie nawet na bieliku, tylko na innych modelach tą wiedzę wykorzystać w biznesie. Albo rzeczywiście na bieliku, kiedy są te te do tego przesłanki, jakbym powiedział, wiedzy, informacje wrażliwe, dane
63:08
Speaker A
wrażliwe czy też wolumetria. I to jest właśnie ten ten ta pierwsza rzecz. I dwa, że my cały czas mówimy bielik, biikelik, ale tak naprawdę ta wiedza jest dla wszelkich modeli kompaktowych SLMów, czyli małych, które możemy wykorzystać. No a ja bym powiedział
63:25
Speaker A
takie większe zastosowanie to już jest biznes albo właśnie te prace biurowe w sektorze publicznym, dobrze obudowany Bielik i właśnie z tą budową przewagi konkurencyjnej. To jest najważniejsza rzecz.
63:36
Speaker A
Super. To Sebastian, zakończmy tą naszą część. Jeżeli jesteś w stanie takim jednozdaniowym podsumowaniem waszych planów na przyszłość. Czy możesz nam coś zdradzić? Jaką macie ambicję teraz? Co przed wami? e albo na czym się skupiacie jako taki właśnie główny kierunek
63:52
Speaker A
Bielika czy całej tej rodziny modeli, którą tworzycie. I na koniec taką puentą jedno dwa call to action, jeżeli masz tą szansę przekazać uczestnikom naszego programu, jako że to jest już taka tradycja każdej edycji.
64:09
Speaker A
Postaram się połączyć te te dwie rzeczy, czyli plany, a też call to action. Yyy, pierwsze rzeczywiście my bardzo chcemy stworzyć model taki wizyjny, to znaczy który będzie yym analizował nam obrazy również w biznesie. Yyy, no i mamy taką
64:26
Speaker A
akcję Obywatelbielik. Można tak obywatel.bielik.ai, AI y, w której za chwilę będzie aplikacja mobilna i będzie można robić zdjęcia i opisywać te zdjęcia i nam przesyłać bez żadnych artystycznych, bez ludzi, innych rzeczy, codzienności, ale takiej właśnie bardzo, bym powiedział
64:44
Speaker A
bez prywatności. Żurek, barszcz, jakaś dobra architektura lub zabytek przyrody. Myślę, że tutaj będzie fantastycznie, jeśli ktoś nam prześle dobrze opisane lokal.
64:57
Speaker A
Czyli korzystamy z tego, że niebawem wakacje planujmy to z Bielikiem, tak? I tu pozwoli nam rozwinąć się w obszarze dużych modeli właśnie takich wizyjnych, no to dużych, kompaktowych modeli wizyjnych. I drugą rzeczą, która jest, no za chwilę wypuszczamy nową
65:13
Speaker A
wersję Pilika z jeszcze większą liczbą języków. I ważne jest, że jak będziecie tą eksperymenty na swojej infrastrukturze, czyli swoim komputerze albo gdzieś tam rzeczywiście legalnie, bym powiedział, zgodnie z procedurami i strategią firmy, w firmie, podzielcie się tym tym takim konstruktywnym
65:32
Speaker A
feedbackiem, nawet jeśli to ja cały czas mówię, że liczba kciuków w dół u nas jest na wagę złota. Jeśli opiszesz ten kciuk w dół, czyli powiesz: "Nie było dobrze, bo na przykład rzeczywiście nie radzisz sobie na przykład z jakąś
65:46
Speaker A
ustrukturyzowaną odpowiedzią albo gdzieś tam poziom halucynacji jest gdzieś jakiś wysoki, albo na przykład w jakimś promptowaniu bardzo złożonym, zaawansowanym gdzieś mamy problemy." Więc wtedy ten kciuk, ale nie sam kciuk, tylko z opisem problemu jest dla nas fantastyczny, bo my wtedy możemy te
66:04
Speaker A
wszystkie odpowiedzi pokurpować i spróbować w nowej wersji pomóc Bielikowi, ale też po prostu polskiemu, polskiej sztucznej inteligencji, polskiemu biznesowi, bo Bielik cały czas jest za darmo i to jest ważne, że my na nim nie zarabiamy, więc no ten feedback
66:21
Speaker A
jest super, że my możemy jeszcze lepiej stworzyć. No i tak każdy z nas może w jakiś sposób dołożyć swoją cegiełkę i ten model współtworzyć, żeby był jeszcze lepszy. A niewiele to kosztuje, bo czas na przetestowanie i feedback do
66:35
Speaker A
odpowiedzi, jeżeli są takie, jakie nas zadowalają lub mamy coś konkretnego do zaadresowania, żeby usprawnić model.
66:42
Speaker A
Super. Sebastian. A budowa wiedzy i kompetencji bezcenna. Bezcenna. Dokładnie. Coś o tym wiemy w tym programie. Bardzo ci dziękujemy za twój czas poświęcony w tym programie i kibicujemy Bielikowi i waszej społeczności jak zawsze co edycję. Ja powiem tak,
66:59
Speaker A
dziękujemy bardzo za zaproszenie, bo my chyba w każdej edycji jesteśmy od samego początku i i zawsze po tej po takim webinarze mamy bardzo dużo nalotu na nasz Discord i się cieszymy. Też jesteście na Discordzie, więc tak bardzo blisko z jednego Discorda Discorda na
67:15
Speaker A
drugiego, a też bardzo często są wspólni znajomi, więc zapraszamy też na Discord. Super, kibicujemy. No i co drodzy uczestnicy, wam bardzo dziękujemy za to, że byliście z nami. Jest 19:7, więc rzeczywiście już jesteśmy lekko po czasie, ale mam nadzieję, że nam to
67:31
Speaker A
wybaczycie. Zachęcamy do dyskusji i kontynuowania ich na Discordzie. Tam na pewno po powrocie do domu zerkniemy.
67:38
Speaker A
Widziałem Sebastian, że bywasz często aktywny na Discordzie, więc pewnie też możemy cię tam złapać. Ja staram się jak mogę. Y, życzymy wam powodzenia w kolejnym drugim tygodniu, do którego materiały macie już dostępne od wczoraj od godziny 20:00. Widzimy, że kolejne
67:55
Speaker A
osoby kończą ten kurs i bardzo nas to cieszy. Yyy, myślcie o tym, żeby w pierwszej kolejności kończyć te lekcje obowiązkowe. Yyy później potraktować właśnie te lekcje nieobowiązkowe jako fajną inspirację, fajne uzupełnienie waszej wiedzy, aby nie poczuć się przesyconym ilością wiedzy yyy, którą
68:13
Speaker A
dla was yyy przygotowaliśmy. Ale to też jest maraton. Przed nami jeszcze kilka tygodni. Dzięki wielkie i widzimy się na kolejnym webinarze na żywo już w przyszłym tygodniu. Informacje mailowo na Discordzie, ale także na platformie.
68:25
Speaker A
Do zobaczenia.
Topics:Umiejętności JutraAI 3.0webinarprawo AImodel językowy Bielikodpowiedzialność AIprogram edukacyjnyDiscordGeminipolski model AI

Frequently Asked Questions

Kto ponosi odpowiedzialność za błędy popełniane przez AI, np. błędną ofertę?

Zasadniczo odpowiedzialność ponosi użytkownik, który składa oświadczenie, jednak pełne zrozumienie wymaga analizy kontekstu i szczegółów sytuacji.

Czy do ukończenia programu Umiejętności Jutra AI potrzebna jest płatna wersja narzędzi AI?

Nie, do ukończenia programu nie jest wymagana płatna wersja żadnego narzędzia, w tym Gemini Pro.

Jakie są główne etapy tworzenia polskiego modelu językowego Bielik?

Proces obejmuje posiadanie odpowiedniego sprzętu, zbieranie i przetwarzanie dużych ilości tekstów, ręczną anotację oraz optymalizację modelu.

Get More with the Söz AI App

Transcribe recordings, audio files, and YouTube videos — with AI summaries, speaker detection, and unlimited transcriptions.

Or transcribe another YouTube video here →