Tech

Wizualny ChatGPT: Microsoft dodaje wizualne możliwości sztucznej inteligencji do ChatGPT za pomocą obrazów

Published

1 rok ago

17 kwietnia, 2023

Wizualny ChatGPT: Microsoft dodaje wizualne możliwości sztucznej inteligencji do ChatGPT za pomocą obrazów

Dzięki Visual ChatGPT firma Microsoft wydała model czatu multimedialnego oparty na ChatGPT, który łączy system sztucznej inteligencji OpenAI z kilkoma modelami Visual Foundation Models (VFM), takimi jak stabilne wdrażanie. Dzięki tym podstawowym modelom wizualnym komputery mogą samodzielnie analizować i tworzyć złożone obrazy. Zespół naukowców skupiony wokół głównego badacza d. Chenfei Wu z Microsoft Asia w Pekinie o swojej niechęci do szkolenia multimedialnego ChatGPT od podstaw. Zamiast tego Menedżer podpowiedzi dla Visual ChatGPT wybiera odpowiednie szablony dla zadania na podstawie instrukcji użytkownika. Visual ChatGPT prawdopodobnie będzie jednym z modułów multimedialnych ogłoszonych przez Microsoft Germany na początku marca 2023 roku.

W przeciwnym razie Visual ChatGPT może opisywać zawartość obrazów i odpowiadać na pytania dotyczące obrazów. Na przykład Visual ChatGPT wyjaśnia, co by się stało, gdybyś wbił igłę w balon.

Historia czatu w Visual ChatGPT

(Zdjęcie: Microsoft)

W tym celu Visual ChatGPT wykorzystuje między innymi model BLIP (pretrening języka i obrazu bootstrap w celu zrozumienia i wygenerowania jednolitego widoku języka, Papier na arXiv.org). Na przykład model ControlNet AI pomaga w dodatkowych instrukcjach sterowania generatorem obrazu AI Stable Diffusion poprzez włączenie interaktywnej pętli sprzężenia zwrotnego do procesu tworzenia obrazu. Konwersacyjna sztuczna inteligencja, taka jak ChatGPT, może dostosować ten monit, tak aby Visual ChatGPT dostarczał wynik lub korygował dane wyjściowe w większej liczbie iteracji na podstawie opinii użytkowników.

Architektura VisualGPT

(Zdjęcie: Chenfei Wu i in.)

Edytuj obrazy za pomocą Visual ChatGPT

Oprócz przekazywania monitów do Stable Diffusion, Visual ChatGPT może również edytować lub dodawać adnotacje do obrazów na czacie na podstawie monitów. Każdy, kto chce dodać inne tło lub kolor do obrazu elementu, może to zrobić za pośrednictwem czatu. Możliwe jest również umieszczanie na czacie prostych, ręcznie rysowanych grafik oraz ich ulepszanie lub modyfikowanie.

Według zespołu Microsoft Asia, Visual ChatGPT w dużym stopniu opiera się na ChatGPT i potrzebuje dostępu do systemu czatu AI OpenAI, aby przypisywać zadania. Opiera się również na uzyskiwaniu dostępu do innych modeli Visual Foundation w celu wykonywania zadań. Dlatego wydajność Visual ChatGPT zależy również od tych modeli.

Visual ChatGPT obsługuje SegmentAnything Meta AI

Segmentowana próbka obrazu według modelu SegmentAnything Model (SAM), Facebook AI Research

(zdjęcie: Facebook AI Research (FAIR))

Microsoft VFM obsługuje teraz również GroundingDINO i SegmentAnything Model (SAM). Firma Facebook AI Research (FAIR lub Meta AI) opublikowała narzędzie SAM do dzielenia obrazów na początku kwietnia 2023 r. Umożliwia to przycinanie obiektów z dokładnością do jednego piksela, tworzenie prawidłowych masek dla każdego wprowadzanego tekstu oraz dodawanie lub wykluczanie regionów. Meta AI to umieściło Pierwszy podstawowy model segmentacji obrazu zanim. Specjaliści AI, którzy zawodowo pracują nad multimediami, nazywają SegmentAnything „momentem widzenia komputerowego GPT-3”, ponieważ sekcja Meta ma dobre zrozumienie kontekstu.

Użytkownicy mogą wysłać zapytanie do Visual ChatGPT za pośrednictwem czatu w różnych językach, takich jak angielski lub chiński, a także dostarczyć zdjęcia. Kod jest napisany w całości w Pythonie lub głównie w Jupyter Notebook Visual ChatGPT jest bezpłatnie dostępny na GitHub na licencji MIT. Zgodnie z repozytorium, jeśli chcesz wypróbować Visual ChatGPT, potrzebujesz również dostępu do API OpenAI. Może to prowadzić do dodatkowych kosztów.

Inni usługodawcy, a także stowarzyszenia open source, takie jak LAION, pracują obecnie nad alternatywami open source dla produktów OpenAI i Microsoft, aby dać użytkownikom i programistom wybór oraz dalej demokratyzować rozwój sztucznej inteligencji. OpenAssistant został właśnie uruchomiony jako alternatywa dla ChatGPT.

(prochowiec)

Russ Abbott

„Ewangelista mediów społecznościowych. Baconaholic. Oddany czytelnik. Badacz Twittera. Zapalony pionier w dziedzinie kawy”.

READ Organizowanie przestrzeni roboczych za pomocą dokowanych folderów › ifun.de

Tech

Take-Two Interactive: GTA VI ukaże się jesienią 2025 roku

Published

3 godziny ago

17 maja, 2024

Russ Abbott

Take-Two Interactive: GTA VI ukaże się jesienią 2025 roku

Obraz: Gry Rockstar

Grand Theft Auto (GTA) pozostaje największą marką Rockstar Games, sprzedając do tej pory ponad 425 milionów egzemplarzy. Nowa część, GTA VI, jest wyczekiwana z niecierpliwością. Spółka-matka Take-Two zawęziła teraz datę premiery: GTA VI ma zadebiutować jesienią 2025 roku.

Po prawdopodobnie największym wycieku w historii gier wideo, który ujawnił wiele na temat kolejnej gałęzi GTA, deweloper Rockstar Games przerwał ciszę na początku grudnia 2023 roku i ogłosił GTA VI ze zwiastunem na rok 2025 na PlayStation 5 i Xbox Series Nie ma jeszcze żadnych informacji na temat wersji na PC.

Teraz spółka-matka Take-Two Interactive zawęziła datę do jesieni 2025 r. w ramach publikacji swoich najnowszych danych kwartalnych. Oznacza to, że gra pojawi się około 12 lat po premierze GTA V.

Premiera GTA VI planowana jest na jesień 2025 roku (Zdjęcie: Take-Two Interactive)

Na razie odrzucono pogłoski o możliwym opóźnieniu do 2026 roku. Zapytany o potencjalne obawy związane z opóźnieniem, dyrektor generalny Take-Two, Strauss Zelnick, powiedział IGN, że jest przekonany, że nowa część zostanie wydana jesienią 2025 roku.

Wydarzenia z szóstej części cyklu gier akcji rozgrywają się ponownie w Vice City, podobnie jak miało to miejsce w czwartej części. Po raz pierwszy kobiety pełnią rolę przywódczą. Ma na imię Lucia i można ją zobaczyć u boku głównej bohaterki w zwiastunie.

GTA to najsilniejsza marka Take-Two

GTA VI niewątpliwie pójdzie w wielkim ślady, ponieważ jego poprzednik GTA V sprzedał się obecnie w ponad 200 milionach egzemplarzy, co czyni go jedną z najlepiej sprzedających się gier wideo wszechczasów. Jak ogłosiło Take-Two, sprzedaż wszystkich gier z serii GTA łącznie przekroczyła 425 milionów egzemplarzy. To również niespotykane w branży.

Poprzednie gry GTA sprzedały się łącznie ponad 425 milionów razy (Zdjęcie: Take-Two Interactive)

Russ Abbott

„Ewangelista mediów społecznościowych. Baconaholic. Oddany czytelnik. Badacz Twittera. Zapalony pionier w dziedzinie kawy”.

READ Najlepsze oferty technologiczne firm Apple, Samsung i Bose

Tech

iCloud Mail: Apple nie może kontrolować zalewu phishingu i spamu

Published

11 godzin ago

16 maja, 2024

Russ Abbott

iCloud Mail: Apple nie może kontrolować zalewu phishingu i spamu

Domniemane dostawy paczek, zwycięskie powiadomienia i rzekomo wolne miejsce w iCloud: wiadomości e-mail ze spamem i phishingiem zalewają obecnie skrzynki odbiorcze wielu użytkowników iCloud Mail. Wygląda na to, że filtr spamu Apple w iCloud nie działa obecnie niezawodnie — a w niektórych przypadkach w ogóle nie działa.

reklama

Czytelnicy od około tygodnia donoszą o zauważalnym wzroście liczby niechcianych e-maili, które Apple nie sortuje już automatycznie i trafiają do skrzynek odbiorczych. Problem nie został jeszcze rozwiązany.

Twoja skrzynka odbiorcza na iPhonie jest pełna spamu

Niektóre z dotkniętych osób codziennie zgłaszają nowe wiadomości spamowe, których liczba jest dwucyfrowa, podczas gdy inne otrzymują tylko kilka dziennie. Redakcja Mac&i zauważyła to również korzystając z konta iCloud. Jak dotąd sortowanie e-maili do folderu ze spamem i zgłaszanie ich Apple nie pomogło. W poprzednich miesiącach filtr spamu firmy Apple wydawał się działać dobrze i wstępnie filtrować większość niechcianych wiadomości e-mail.

Większość e-maili to oczywiste oszustwa dla doświadczonych użytkowników. Niektóre z nich są również skierowane specjalnie do użytkowników Apple i ostrzegają przed przekroczeniem limitu miejsca w iCloud. Jako remedium zapewniamy bezpłatne miejsce na dysku w iCloud. Wszystko, co musisz zrobić, to „potwierdzić” dane swojego Apple ID i karty kredytowej, jak wynika z jednego e-maila phishingowego.

Inne adresy iCloud jako odbiorcy

Wiersze tematów często zawierają znaki specjalne, a adresy e-mail innych użytkowników usługi iCloud są zawsze wymienione jako odbiorcy – i nie jest jasne, czy te osoby faktycznie istnieją. Dotknięci użytkownicy nie mogą obecnie wiele zrobić. Niż zgłosić spam jako spam Dlatego usuń je ze swojej skrzynki odbiorczej i miej nadzieję, że Apple odzyska kontrolę nad procesem filtrowania.

(funt)

Russ Abbott

„Ewangelista mediów społecznościowych. Baconaholic. Oddany czytelnik. Badacz Twittera. Zapalony pionier w dziedzinie kawy”.

Tech

Wbudowana aktualizacja AI: GPT-4o, pole testowe Air Cargo AI, stabilizacja AI, ORBIT-Surgical

Published

19 godzin ago

16 maja, 2024

Russ Abbott

Wbudowana aktualizacja AI: GPT-4o, pole testowe Air Cargo AI, stabilizacja AI, ORBIT-Surgical

GPT-4o nie jest jeszcze całkiem dostępny

reklama

Prezes OpenAI, Sam Altman, jest bardzo zajęty: oprócz głównego naukowca Ilyi Sutskevera, firmę opuszcza także badacz bezpieczeństwa Jan Lake. Nie jest jasne, dlaczego dwie z tych ważnych osobistości złożyły rezygnację. A potem Altman musiał doprecyzować inny temat w X. Ponieważ nikt obecnie rozmawiający z ChatGPT nie rozmawiał jeszcze z GPT-4o, co zostało ogłoszone w poniedziałek.

Wbrew temu, co sugerowano w poniedziałkowym ogłoszeniu, nie wszystkie funkcje GPT-4o zostały jeszcze zintegrowane z obecną wersją ChatGPT. Według Altmana nowy tryb audio nadal korzysta z poprzedniej wersji. Tryb tekstowy musi być oparty na GPT-4o. Wszystkie pozostałe funkcje zostaną początkowo udostępnione subskrybentom ChatGPT Plus w nadchodzących tygodniach i miesiącach.

Google oferuje LearnLM

Oferty Google z „Ucz sięLM„Nowa rodzina modeli opracowana specjalnie dla sektora edukacyjnego Modele mają działać jako inteligentni asystenci dla nauczycieli i uczniów oraz zapewniać indywidualne wsparcie w procesie uczenia się. LearnLM może odpowiadać na pytania, udzielać wyjaśnień, tworzyć zadania, a nawet oceniać prace domowe.

Modele są szkolone przy użyciu obszernych danych z podręczników, publikacji naukowych i zasobów edukacyjnych. Specjalizując się w treściach edukacyjnych, mają na celu zapewnienie dokładniejszych i bardziej wiarygodnych wyników niż ogólne modele językowe.

Modele są przeszkolone w zakresie wykrywania i filtrowania nieodpowiednich treści. Ponadto rygorystyczne wytyczne dotyczące ochrony danych muszą zapewniać ochronę danych użytkowników.

Dzięki LearnLM Google chce wykorzystać potencjał sztucznej inteligencji, aby uczynić edukację bardziej dostępną, skuteczną i interaktywną. Formularze będą stopniowo integrowane z istniejącymi usługami Google, takimi jak Google Classroom i Google Scholar. Pierwsze testy już trwają, np. na YouTube w USA, gdzie na pytania związane z wykładami można odpowiedzieć za pomocą LearnLM.

Roboty ładujące i sztuczna inteligencja mają usprawnić transport lotniczy

Federalne Ministerstwo Cyfryzacji i Transportu wspiera „cyfrowe pole testowe” na siedmiu niemieckich lotniskach w celu poprawy efektywności łańcucha transportu lotniczego. Przedsiębiorstwa żeglugowe, Uniwersytet Nauk Stosowanych we Frankfurcie oraz, w razie potrzeby, Airbus i Zrzeszenie Międzynarodowego Transportu Powietrznego (IATA) współpracują pod przewodnictwem Instytutu Przepływu Materiałów i Logistyki im. Fraunhofera.

Dzięki lepszej komunikacji pomiędzy aktorami, wsparciu procesów cyfrowych i wykorzystaniu sztucznej inteligencji należy optymalnie wykorzystać ograniczone zasoby i obniżyć koszty w dłuższej perspektywie. Nacisk położony jest na standard danych ONE Record, prognozy wykorzystania przestrzeni ładunkowej oparte na sztucznej inteligencji i wykorzystanie zautomatyzowanych robotów ładujących.

Parlamentarny sekretarz stanu Oliver Luksic powiedział: „Potrzebujemy sztucznej inteligencji w lotnictwie, aby zachować konkurencyjność na poziomie międzynarodowym”. „Tylko w ten sposób możemy ukierunkować wykorzystanie pracowników, których jest coraz mniej, i optymalnie wykorzystać ograniczoną infrastrukturę, a tym samym w dłuższej perspektywie obniżyć koszty”.

Projekt „Digital Air Cargo Field Testing” prowadzony przez Instytut Przepływu Materiałów i Logistyki im. Fraunhofera istnieje od 2021 roku i został już dofinansowany przez Ministerstwo Transportu. Ministerstwo podwaja obecnie wsparcie do łącznej kwoty 13,7 mln euro. Uczestnicy z sektora prywatnego wnieśli łącznie 4,3 mln euro, co daje łączną kwotę 18 mln euro. Oznacza to, że projekt może trwać do 2026 roku. Opracowane rozwiązania zostaną udostępnione jako open source i posłużą jako model dla powiązanych branż.

Stabilność sztucznej inteligencji w negocjacjach sprzedażowych

Znaleziono startup zajmujący się sztuczną inteligencją Stability AI, znany z generatora obrazów open source Stable Diffusion Według źródeł zaznajomionych z negocjacjami sprzedażowymi. Pomimo miliardowej wyceny, rezerwy gotówkowe firmy zostały prawie wyczerpane.

Wysokie wydatki na badania i moc obliczeniową, brak realnych modeli przychodów i zamieszanie administracyjne spowodowały przewidywaną stratę w wysokości 142 milionów dolarów na bieżący rok. Aktywa płynne o wartości mniejszej niż 4 miliony dolarów są równoważone zobowiązaniami o wartości około 100 milionów dolarów wobec dostawców usług w chmurze.

Potencjalni nabywcy będą prawdopodobnie szczególnie zainteresowani od 70 do 90 ekspertami AI, wybranymi podejściami technologicznymi i marką Stable Diffusion.

„ORBIT-Surgical” do symulacji robotów chirurgicznych

Naukowcy z Uniwersytetu w Toronto, Uniwersytetu Kalifornijskiego w Berkeley, ETH Zurich, Georgia Tech i Nvidia wpadli na „Orbita Chirurgia„, framework open source do symulacji robotów chirurgicznych. Wykorzystuje platformę robotyki Nvidia „Isaac Sim” do obliczeń fizyki akcelerowanych przez GPU oraz narzędzie 3D „Omniverse” z renderowaniem metodą ray tracingu. Dzięki równoległości można przeprowadzić do 8000 symulacji uruchamiane jednocześnie Jeden na jednym procesorze graficznym Zdaniem zespołu umożliwia to efektywne szkolenie w ciągu zaledwie kilku godzin, a nie dni czy tygodni, jak miało to miejsce na wcześniej używanych platformach.

ORBIT-Surgical zawiera modele prawdziwych robotów chirurgicznych i 14 zadań referencyjnych odzwierciedlających podstawowe umiejętności chirurgiczne. Należą do nich proste ruchy i interakcja ze stałymi i odkształcalnymi obiektami, takimi jak igły i rurki. Korzystając z urządzeń wejściowych, takich jak kontrolery rzeczywistości wirtualnej, eksperci mogą sterować symulowanymi robotami w czasie rzeczywistym. Nagrane ruchy są następnie wykorzystywane do nauki poprzez naśladownictwo.

Symulacja umożliwia także tworzenie realistycznych, syntetycznych obrazów, które poprawiają wydajność modeli segmentacji obrazu wymaganych przez roboty. Zespół zademonstrował już przeniesienie wytrenowanych modeli na prawdziwe roboty – konieczne są jednak dalsze udoskonalenia. W przyszłości ORBIT-Surgical będzie obsługiwał bardziej złożone zadania, takie jak szycie. Framework jest dostępny na GitHubie.

Meredith Whittaker ostrzega, że firmy zajmujące się sztuczną inteligencją mają zbyt dużą władzę

Amerykańska badaczka sztucznej inteligencji Meredith Whitaker odebrała w środowy wieczór w Hamburgu Nagrodę im. Helmuta Schmidta dla przyszłości. Podczas ceremonii wręczenia nagród Whittaker powiedział o branży technologicznej: „Nie musimy konkurować z gigantami na ich warunkach. Nie pozwólmy im dyktować ram”.

Pod sztandarem superpotężnej, superpotężnej sztucznej inteligencji – często okraszonej quasi-religijnymi przewidywaniami na temat czujących maszyn i superkomputerów – firmy te będą starały się rozszerzyć swoje wpływy i kontrolę na wszystkie sfery życia i niemal każdy region planety . – podkreślił Prezydent Signal.

Jest pewna, że za filantropijną retoryką wielkich firm technologicznych kryje się więcej marketingu niż rzeczywistości. Dopiero gdy ta zasłona zostanie rozdarta, będziemy mogli poważnie zacząć przeglądać i przeprojektowywać naszą przyszłość technologiczną. Ponieważ wciąż jest czas, aby stworzyć piękną, godną życia przyszłość, mówi Whittaker. Od 2022 r. Nagroda im. Helmuta Schmidta dla przyszłości honoruje innowacyjne osiągnięcia w obszarach demokracji, społeczeństwa i technologii.

Jak inteligentna jest sztuczna inteligencja? Jakie są konsekwencje generatywnej sztucznej inteligencji dla naszej pracy, czasu wolnego i społeczeństwa? W ramach aktualizacji AI Heise, we współpracy z The Decoder, codziennie dostarczamy aktualizacje dotyczące najważniejszych osiągnięć AI. W piątki wraz z ekspertami przyglądamy się różnym aspektom rewolucji AI.