WSTĘP DO AL/ML – WPŁYW AI/ML NA PROCESY WYTWARZANIA U POLSKICH WYTWÓRCÓW. Poszukiwanie definicji, regulacji i rozwiązań

Kategoria: Produkcja i maszyny
10 min. czytania

Przygotuj się do wdrożenia nowych technologii AI/ML

Często swoim rozmówcom zwracam uwagę, że w dzisiejszych czasach, jeśli stoimy, to już się cofamy. Obecny pęd i tempo zmian jest ogromne. Przypomina wyścig, aby przy użyciu najnowszych technologii przetwarzania informacji uzyskać przewagę rynkową. Celem jest kreowanie trafnych prognoz, które powinny w pełni zwalidować się w najbliższej, czekającej nas rzeczywistości. Mowa tu o technologii informatycznej opartej na sztucznej inteligencji (ang. Artificial Intelligence, AI) przy wykorzystaniu metod uczenia maszynowego (ang. Machine Learning, ML).

Działamy jednak w specyficznym środowisku wytwarzania produktów leczniczych. Wymaga ono specjalnego podejścia, ukierunkowanego na bezpieczeństwo pacjenta korzystającego z produktów leczniczych stosowanych w terapii chorób.

Rys. 1. Biophorum IT, Digital Plant Maturity Model (DPMM)3.0 Addendum to the DPMM v1 white paper

Każda firma farmaceutyczna, jak i współpracująca z wytwórcą powinna ocenić i zaplanować połączenie, wdrożenie, implementację takich rozwiązań. Należy te działania w sposób przemyślany zaplanować, opierając na przeglądach dojrzałości DMMP (Digital Plant Maturity Model), odnosząc się do oceny cyklu życia produktów, procesów i systemów skomputeryzowanych. Najpierw trzeba określić jako punkt wyjścia, gdzie w tym rozwoju jesteśmy i gdzie planujemy dotrzeć.

Należy określić, jaka jest nasza gotowość organizacyjna, czyli sprawdzić/zweryfikować wsparcie instytucjonalne potrzebne do transformacji cyfrowej w firmie, oceniając zaangażowanie, budżet i personel.

Drugi ważny aspekt dotyczy gotowości technicznej, którą ocenia się zgodnie z listą kontrolną wymagań technicznych. Należy poddać ocenie infrastrukturę, mapę danych, polityki i wiedzę na temat realizowanych procesów głównych i pomocniczych w organizacji.

Obecnie w naszym środowisku w Europie i na całym świecie trwa dyskusja i wskazane jest, aby firmy farmaceutyczne i współpracujące z przemysłem farmaceutycznym miały własne stanowisko w odniesieniu do tematyki AI/ML.

WARTO WIEDZIEĆ, czym jest, a czym nie jest AI/ML

Nie wypracowano jak dotąd prawnej definicji sztucznej inteligencji w ustawodawstwach krajowych i konwencjach międzynarodowych. Podejmowane są natomiast próby opisowego podejścia.

„Sztuczną inteligencję (ang. Artificial Intelligence – AI) próbuje się definiować jako dziedzinę wiedzy obejmującą m.in. sieci neuronowe, robotykę i tworzenie modeli zachowań inteligentnych oraz programów komputerowych symulujących te zachowania, włączając w to również uczenie maszynowe (ang. machine learning), głębokie uczenie (ang. deep learning) oraz uczenie wzmocnione (ang. reinforcement learning)”.

Źródło: www.gov.pl/web/ai/czym-jest-sztuczna-inteligencja2

W dokumentach Komisji Europejskiej z kolei sztuczną inteligencję określa się jako:

„ (…) zaprojektowane przez ludzi systemy oprogramowania (i ewentualnie również sprzętu), które, biorąc pod uwagę złożony cel, działają w wymiarze fizycznym lub cyfrowym, postrzegając swoje środowisko poprzez pozyskiwanie danych, interpretując zebrane ustrukturyzowane lub nieustrukturyzowane dane, rozumując na podstawie wiedzy lub przetwarzając informacje, uzyskane z tych danych i decydując o najlepszym działaniu (działaniach), jakie należy podjąć, aby osiągnąć dany cel. Systemy AI mogą wykorzystywać reguły symboliczne lub uczyć się modelu numerycznego, a także dostosowywać swoje zachowanie poprzez analizę wpływu poprzednich działań na środowisko.

Jako dyscyplina naukowa AI obejmuje kilka podejść i technik, takich jak uczenie maszynowe (którego konkretnymi przykładami są uczenie głębokie i uczenie wzmacniające), rozumowanie maszynowe (które obejmuje planowanie, harmonogramowanie, reprezentację wiedzy i rozumowanie, wyszukiwanie i optymalizację) oraz robotykę (która obejmuje sterowanie, percepcję, czujniki i siłowniki, a także integrację wszystkich innych technik w systemy cyberfizyczne)”.

Uzgodniono na poziomie międzynarodowym, że w zakresie ujęcia definicji sztucznej inteligencji od strony modelu systemowego, technicznego i technologicznego mamy do czynienia z Systemem AI. Tym samym polska Polityka AI przyjmuje za własną definicję Systemu AI wypracowaną w ramach OECD przez grupę niezależnych ekspertów AIGO (OECD).

System AI zgodnie z definicją organizacji OECD to: „system oparty na koncepcji maszyny, która może wpływać na środowisko, formułując zalecenia, przewidywania lub decyzje dotyczące zadanego zestawu celów”.

„Czyni to, wykorzystując dane wejściowe, dane maszynowe lub ludzkie do:

  • postrzegania rzeczywistych lub wirtualnych środowisk,
  • streszczania takiego postrzegania w modele ręcznie lub automatycznie,
  • wykorzystywania interpretacji modeli do formułowania opcji wyników.

 W schemacie system sztucznej inteligencji składa się z trzech głównych elementów:

  • czujników (sensorów),
  • logiki operacyjnej (modeli algorytmów),
  • siłowników (aparatu wykonawczego).

Czujniki zbierają nieprzetworzone dane ze środowiska, a siłowniki podejmują działania w celu zmiany stanu środowiska. Kluczowa siła systemu sztucznej inteligencji znajduje się w jego logice operacyjnej (modelach algorytmów), która dla danego zestawu celów i na podstawie danych wejściowych z czujników zapewnia ekstrakcje (wynik) dla siłowników – jako zalecenia, przewidywania lub decyzje, które mogą wpłynąć na stan środowiska”.

Źródło: www.gov.pl/web/ai/czym-jest-sztuczna-inteligencja2

Rys. 2. Schemat Systemu AI, zgodnie z definicją organizacji OECD
Źródło:www.gov.pl/web/ai/czym-jest-sztuczna-inteligencja2

Tyle mówią nam oficjalnie obowiązujące w Polsce cytowane powyżej definicje i schematy. Polecam je stosować i używać od samego początku w rozmowach z dostawcami tej kategorii rozwiązań. Jest to, w mojej opinii, wiedza podstawowa dla wszystkich osób zajmujących się w firmach tą tematyką.

Prawidłowa kwalifikacja rozwiązań od samego początku ustrzeże nas przed błędną oceną rozwiązania kwalifikującego system do kategorii AI. W ostatnim czasie zauważalne jest nagminne posługiwanie się określeniem AI, aby wykorzystać jego siłę marketingową do rozwiązań niedziałających w oparciu o modele ML. Poniżej pragnę przytoczyć z oficjalnej strony polskiego rządu, jeszcze bardziej przejrzysty schemat pokazujący, czym jest sztuczna inteligencja.

Rys. 3. Rodzaje sztucznej inteligencji
Źródło: www.gov.pl/web/ai/czym-jest-sztuczna-inteligencja2

EMA i FDA dyskutują, jaki wpływ ma AI/ML na cykl życia produktu

Organ FDA zwrócił się do środowiska nauk przyrodniczych z szeregiem pytań, na które oczekuje odpowiedzi. Jednocześnie agencja sama dostrzegła i wskazała obszary, w których obecnie i potencjalnie mogą być zastosowane systemy AI.

Są to:

  1. Badania nad nowymi produktami leczniczymi.
  2. Badania niekliniczne – GLP.
  3. Badania kliniczne.
  4. Nadzór i śledzenie po wprowadzeniu produktu leczniczego do obrotu.
  5. Zaawansowany proces wytwarzania produktów leczniczych od procesu projektowania poprzez proces kontroli do monitorowania i utrzymywania prawidłowej jakości produktu w całym procesie produkcji i dostarczania do pacjenta.

W tym samym czasie EMA opublikowałam dokument otwierający debatę na temat wykorzystania sztucznej inteligencji w cyklu życia produktu. Prace nad tym tematem zaplanowane zostały do 2025 roku. Drugi ważny w kontekście AI dokument, który rok wcześniej wydała EMA odnosi się do pilnej potrzeby rewizji i aktualizacji Aneksu 11, dotyczącego wymagań dla systemów skomputeryzowanych. Została w nim wskazana pilna potrzeba opracowania wytycznych regulacyjnych dla stosowanych modeli AI i ML w krytycznych zastosowaniach GMP, ponieważ przemysł już wdraża te technologie. W zapisie tam zamieszczonym czytamy, że główny nacisk należy położyć na istotność, adekwatność i integralność danych wykorzystywanych do testowania tych modeli oraz na wyniki tych testów, niż na proces wyboru, uczenia i optymalizacji modeli.

Harmonogram prac nad brzmieniem Aneksu 11 podaje, że termin zgłaszania uwag do wytycznych upływa w marcu 2025 roku. Tym bardziej zachęcam do dyskusji przed uchwaleniem zapisów, które w Polsce, w randze rozporządzenia wykonawczego do Ustawy Prawo farmaceutyczne, będą miały wpływ na utrzymanie Zezwoleń na wytwarzanie produktów leczniczych przez polskich wytwórców.

Działania przemysłu są szczególnie widoczne w odniesieniu do fazy badawczo-rozwojowej czy fazy badań klinicznych. Poniższy schemat natomiast wskazuje na potencjał danych znajdujących się w obszarze procesu wytwarzania w zakresie śledzenia jakości produktu w procesie kontroli i monitorowania procesów wytwarzania.

Rys. 4. Mapa potencjalnych źródeł danych dla sztucznej inteligencji
Źródło: Jerry Chapman „How AI Tools will Transform Quality Management in the Life Sciences.” Pharmaceutical online 2018

Stosując zapisy obecnie obowiązującego Aneksu 11 EU GMP i aktualną drugą edycję metodologii Gamp 5, mamy podstawy do działania w ramach wdrażania digitalizacji i walidacji procesów.

Metodologia Gamp 5 edycja 2. wspiera nas w zadaniach, jak planować, wdrażać i dokumentować działania walidacyjne i zarządzać utrzymaniem tej najnowszej technologii informatycznej.

Określa ona ML jako subdyscyplinę AI oraz podsystem aplikacji i/lub rozwiązania biznesowego.

ML traktuje się jako metodę analizy danych, polegającą na budowaniu i automatyzacji modeli matematycznych (tj. algorytmów) na podstawie danych, w celu przewidywania lub podejmowania decyzji.

Gamp 5 edycja 2. zawiera dedykowany załącznik D11 dotyczący AI/ML, a przedstawiający ramy cyklu życia AI/ML odnoszące się do oceny ryzyka, zasad GAMP5 i faz cyklu życia systemu. ML jest zasilany i wykorzystuje różnego typu dane, takie jak dane badawcze, dane laboratoryjne, dane produkcyjne lub dane kliniczne w całym cyklu życia produktu. Wytyczne Gamp 5 edycja 2, jak i Przewodnika dobrych praktyk ISPE Gamp RDI: Integralność danych od samego początku edycja 1, ze względu na kluczowe znaczenie dla ML jakości danych, odnoszą się do przykładów oceny ryzyka jakości i integralności danych oraz ryzyka dla samego algorytmu ML w fazie koncepcji, projektu i działania.

Uczenie Maszynowe – rodzaje i przykład

W zależności od celu projektu wybierany jest odpowiedni typ uczenia maszynowego ML.

Rys. 5. Typy uczenia maszynowego
Źródło: https://vitiya99.medium.com/what-is-machine-learning-d747248ab95e

Algorytmy uczenia maszynowego pomogą nam gromadzić, przechowywać i analizować dane oraz generować wartościowe wyniki. Narzędzia te pozwalają ocenić stan skomplikowanych i pogrupowanych danych. Uczenie maszynowe oferuje różne narzędzia pozwalające zrozumieć złożone dane poprzez ich segmentację i uproszczenie. Ponadto umożliwia ono automatyzację zadań biznesowych i podejmowanie lepszych decyzji dzięki uporządkowanym danym. Z pewnością w uczeniu maszynowym dane działają jak paliwo. Użytkownik wprowadza nowe dane do modelu uczenia maszynowego, a ten, analizując wszystkie wymagane dane, generuje pożądany wynik. Algorytm będzie wykorzystywał odpowiednie dane do uzyskania wyników. Dlatego ważne jest, aby konsekwentnie udoskonalać dane. Uszlachetnianie pomoże usunąć ze zbiorów danych nieistotne i nieaktualne dane. Dane te nie są już potrzebne, aby mieć wpływ na wynik. Nieistotne dane w algorytmie będą wpływać na wynik oraz na dokładność i skuteczność modelu. Dlatego usunięcie nieistotnych danych ma zasadnicze znaczenie dla zwiększenia wydajności wyniku

Ten postęp w przetwarzaniu danych (trwa np. w fazie R&D) jest faktem. Swój sukces zawdzięcza obniżeniu kosztów fazy badawczo-rozwojowej.

R&D cost savings of between $300 million and $400 million per successful drug. ( ..Cytvia…)

To measure and validate the model’s performance, Cytiva deployed its solution at user sites over the course of a year. Our results show up to a 90% reduction in analysis time — saving one collaborator more than eight hours per experiment on assays they run multiple times per week. By eliminating the time-consuming manual steps of curating and visually assessing data both pre-and post-fitting, our transparent machine learning prototype achieved significant outcomes for developers throughout the industry (Figure 1)

AI(d) To Increase Drug Discovery Productivity And Optimize SPR Data Interpretation

Source:Cytiva Article| September 17, 2021

By Paul Belcher, Product Strategy Manager, and Martin Teichert, Global Product Manager, Cytiva

Obecnie jednym z używanych narzędzi jest np. tzw. GAN (generative adversarial networks) –generatywne sieci współzawodniczące, czyli dwie niezależne sieci neuronowe: dyskryminator – który uczy rozpoznawać dane, i generator – który uczy generować dane. Ogólnie GAN będzie działać jako architektura algorytmiczna przy użyciu dwóch sieci neuronowych. Obie sieci będą przeciwstawiać się sobie, aby wygenerować syntetyczne i nowe instancje danych, przeszukując dostępne, prawdziwe dane. Można go używać do generowania wideo, rozpoznawania głosu i generowania obrazów. Będą one dystrybuować dane i naśladować siebie nawzajem. Ich wydajność będzie niezwykła dla wszystkich dziedzin, takich jak mowa, muzyka, obrazy i proza.

Modelowanie generatywne jest zadaniem uczenia maszynowego dla uczenia bez nadzoru. Obejmuje ono uczenie się regularności, automatycznych odkryć lub wzorców jako danych wejściowych. W ten sposób model może używać nowych danych generatywnych do uczenia maszynowego, co wiąże się z automatycznym uczeniem się. Możesz wykorzystać wszystkie prawidłowości lub wzorce w danych wejściowych w sposób, który generuje nowe przykłady, które możesz wyciągnąć z oryginalnego zbioru danych.

Jeżeli użyjemy narzędzia GAN do szkolenia modelu generatywnego i kadrowania problemu dla uczenia nadzorowanego z dwoma submodelami, to możemy:

  • Usprawnić proces identyfikowania cząsteczek jako potencjalnych leków, co zwiększa szanse na sukces tych zidentyfikowanych poprzez przetwarzanie ogromnych ilości istniejących danych badawczych i wykorzystanie modelowania predykcyjnego w celu określenia możliwych leków.
  • Syntetyzować ogromne ilości danych biomedycznych i przekształcać w informacje, które są łatwiej interpretowalne dla ludzi.
  • Generować nowe, nieznane wcześniej związki o pożądanych właściwościach biologicznych (tj. projektowanie leków de novo).
  • Skuteczniej analizować dane w celu lepszego wyjaśnienia mechanizmu działania leku i zwiększenia szans na przetestowanie leków w populacjach, które z największym prawdopodobieństwem odniosą z nich korzyści.

Gdy zadziałają prawa Murfiego:

  • Podstawowe Prawo Murphy’ego:
    To co może się nie udać, nie uda się na pewno.
  • Pochodne Prawo Murphy’ego:
    Nie uda się nawet wtedy, gdy właściwie nie powinno się nie udać. Wszystko wali się naraz.

Dla przykładu:

  1. Na bardziej podstawowym poziomie niewystarczające dane szkoleniowe i słaba kalibracja modelu mogą doprowadzić do wystąpienia stronniczości w rejestrowanym wyniku otrzymywanym z danej wersji aplikacji modelu.
  2. Możliwość zastosowania wszystkich modeli uczenia maszynowego w dużym stopniu zależy od źródeł wykorzystywanych danych. Jest to szczególnie istotne w przypadku korzystania z modeli uczenia maszynowego w opiece zdrowotnej, gdzie danych jest często dużo, ale również najczęściej pochodzą one z dużych akademickich ośrodków referencyjnych w uprzemysłowionych krajach zachodnich (gdzie ludzie mają lepszy i większy dostęp do systemu opieki zdrowotnej, a co za tym idzie, mają większe szanse na ich wykorzystanie). Te populacje są często niezrównoważone pod względem ciężkości choroby i danych demograficznych, co z kolei może skutkować podobnie wypaczonymi przewidywaniami modeli.
  3. Nieprawidłowo skupione dane mogą nadmiernie wpływać na modele tworzone przy użyciu metodologii uczenia się bez nadzoru, a określenie zakresu takich modeli wymaga dodatkowej analizy. Aby uniknąć sytuacji, w której sztuczna inteligencja i uczenie maszynowe będą jeszcze bardziej zaostrzać problemy związane z uprzedzeniami i brakiem różnorodności, które są już nieodłącznym elementem systemu opieki zdrowotnej, firmy będą musiały wbudować korekcję (wynikająca z nierównomiernego dostępu do danych dotyczących zdrowia) w algorytmy, których używają do odkrywania i opracowywania leków.

Konkretne procesy oceny i eliminacji błędu systematycznego w algorytmach będą musiały zostać opracowane i rutynowo wykorzystywane w całym procesie.

Ponadto, jeśli pozostawi się je bez ograniczeń, modele generatywne mogą generować związki, które są zbyt złożone lub niemożliwe do wytworzenia.

Jednocześnie ostatecznie przewidywane właściwości biologiczne lub fizyczne nowej cząsteczki nadal muszą zostać potwierdzone w laboratorium.

Naukowcy muszą podjąć kroki, aby zapewnić, że ich cząsteczki generowane przez ML są realistyczne (stabilne chemicznie i zdolne do syntezy) bez zmniejszania skuteczności.

Podsumowanie:

  1. Zapisy prawne nie są jednoznaczne w odniesieniu do AI/ML. Aktualizacja przepisów w toku Aneksu 11 zaplanowana do marca 2025 roku, aby przygotować się do zmiany i interpretacji ważnych wymagań.
  2. W projektach z zakresu AI/ML warto działać zgodnie z wytycznymi aktualnej metodologii Gamp 5 edycja 2. z lipca 2022 roku.
  3. Stawianie pytań co do ryzyka , właścicielstwa procesów, danych oraz odpowiedzialności, przejrzyste zasady zarządzania w całym cyklu życia produktu leczniczego wspieranego systemami skomputeryzowanymi pomagają odpowiedzialnie planować , wdrażać i utrzymywać w zgodności z GxP nowe technologie zgodnie z postępem naukowo-technicznym.  
  4. Uczestniczenie w procesie opiniotwórczym przepisów GxP zapewnia bardziej stabilną perspektywę rozwoju i daje możliwość wyjaśniania złożoności zagadnień w oparciu o wyniki i doświadczenie ze zrealizowanych projektów, co zapobiega nieporozumieniom interpretacyjnym podczas audytów.

Bibliografia

  1. https://www.gov.pl/web/ai/czym-jest-sztuczna-inteligencja2.
  2. EMA Reflection paper on the use of Artificial Intelligence (AI) in 5 the medicinal product lifecycle; 13 July 2023; EMA/CHMP/CVMP/83833/2023.
  3. EMA Concept Paper on the revision of Annex 11 of the guidelines on Good Manufacturing Practice for medicinal products – Computerised Systems.
  4. Tina Hu-Rogers, Buchanan Ingersoll & Rooney. „AL/ML in Drug Discovery & Development: Potential and Challenges”. Bioprocess online 2023.
  5. Jerry Chapman. „How AI Tools will Transform Quality Management in the Life Sciences”. Pharmaceutical online 2018.

Dodatkowe informacje

Artykuł został opublikowany w kwartalniku „Świat Przemysłu Farmaceutycznego” 1/2024

Autorzy

  • Monika Wolańczyk

    Starszy Specjalista ds. Walidacji
    Introl Automatyka