MLOps Galileo получава 18 милиона долара, за да стартира безплатна услуга

ГалилеоДнес стартираща компания, стартираща платформа за разработка на AI модели, обяви, че е събрала 18 милиона долара в кръг от Серия A, воден от Battery Ventures с участието на The Factory, Walden Catalyst, FPV Ventures, съоснователя на Kaggle Антъни Голдблум и други ангелски инвеститори. Новите пари довеждат общата печалба на компанията до 23,1 милиона долара, каза главният изпълнителен директор Викрам Чатърджи по имейл на TechCrunch, и ще бъдат насочени към увеличаване на инженерните екипи на Galileo, излизане на пазара и разширяване на платформата, за да поддържа нови методи за данни.

Тъй като използването на AI става все по-разпространено в цялата организация, търсенето на продукти, които улесняват проверката, откриването и коригирането на критични грешки на AI, нараства. Според един Наскоро Проучване (от общността MLOps), 84,3% от учените по данни и инженерите по машинно обучение казват, че времето, необходимо за откриване и диагностициране на проблеми в модел, е проблем за техните екипи, докато повече от един на всеки четирима (26,2%) признават, че отнема седмица или повече за откриване и отстраняване на проблеми.

Някои от тези проблеми включват неправилни данни, при които етикетите, използвани за обучение на AI система, съдържат грешки, като например изображение на дърво, което погрешно е наречено „стайно растение“. Други се отнасят до изкривяване на данните или дисбаланс на данните, което се случва, когато данните се развиват, за да направят една AI система по-малко точна (помислете за модел на фондовия пазар, обучен на данни от преди пандемията) или данните не представят адекватно домейна (напр. Данните е група от хора с по-светла кожа, а не с по-тъмна кожа.)

Платформата Galileo има за цел да рационализира тръбопроводите за разработка на AI в екипи с „автоматизирани регистратори“ и алгоритми, които подчертават проблемите със сривовете на системата. Проектиран да бъде разгърнат в локална среда, Galileo sВ работните процеси на AI – от предварителна разработка до постпродукция – както и модалности на неструктурирани данни като текст, реч и визия.

В науката за данните „неструктурираните“ данни обикновено се отнасят до данни, които не са подредени според предварително изграден модел на данни или схема, като фактури или данни от сензори. Атиндрио Санял – вторият съосновател на Galileo – подчертава, че базираните на Excel и Python процеси за осигуряване на висококачествено въвеждане на данни в моделите са ръчни, податливи на грешки и скъпи.

Галилео

Екранна снимка на Galileo Community Edition. Кредити за изображения: Галилео

Когато сканират своите данни с Galileo, потребителите незабавно откриват дългата опашка от грешки в данните, като грешно етикетирани данни и недостатъчно представени езици. [and] „Отпадъчни данни, които те могат незабавно да предприемат действия в рамките на Galileo чрез премахване или повторно маркиране или чрез добавяне на подобни допълнителни данни от производството”, каза Sanyal за TechCrunch в интервю по имейл. Galileo автоматично позволява на екипите да научат за отклонението на данните и показва най-ценните данни да тренираме следващия.“

Екипът на съоснователите на Galileo е прекарал повече от десетилетие в изграждането на продукти за машинно обучение, които според тях са поели директно предизвикателствата на разработването на AI системи. Чатерджи ръководеше продуктовия мениджмънт на Google AI, докато Sanyal ръководеше инженерството в отдела за изкуствен интелект на Uber и беше ранен член на екипа на Siri в Apple. Яш Шет, третият съосновател на Galileo, е друг ветеран на Google, който преди това е ръководил екипа на компанията за платформа за разпознаване на реч.

Платформата Galileo попада в разрастващата се категория софтуер, известна като MLOps, набор от инструменти за внедряване и поддържане на модели за машинно обучение в производството. Това е сериозно искане. по един ОценкаПазарът на MLOps може да достигне 4 милиарда долара до 2025 г.

Няма недостиг на стартиращи компании, преследващи пространство, като напр кометакоято събра 50 милиона долара миналия ноември. Сред другите доставчици, които поддържат VC Той тъгувашеИ на тектонскиИ на Гмуркащ самолетИ на асоциативен Базирана в Тайван излъчване на изкуствен интелект.

Но въпреки че Galileo стартира само преди няколко месеца, Galileo плаща на клиенти от стартиращи фирми с “висок растеж” до компании от Fortune 500, твърди Sanyal. „Нашите клиенти използват системата Galileo, докато изграждат приложения за машинно обучение, като откриване на реч на омразата, откриване на намерение на обаждащия се в кол центрове и подобряване на потребителското изживяване с разговорен AI“, добави той.

Sanyal очаква, че стартирането на безплатната оферта на Galileo – Galileo Community Edition – ще увеличи още повече абонаментите. Sanyal каза, че изданието на общността позволява на учените по данни, работещи върху обработката на естествен език, да изграждат модели за машинно обучение, използвайки някои от инструментите, включени в платената версия.

С Galileo Community Edition всеки може да се регистрира безплатно или да добави няколко реда код, докато обучава модела си с етикетирани данни или докато изпълнява извод с немаркирани данни, за да провери незабавно, да намери и поправи грешки в данните или да избере правилните данни за следващ етикет с помощта на мощния потребителски интерфейс на Galileo.

Sanyal отказа да сподели цифрите за приходите, когато беше попитан. Но той отбеляза, че броят на служителите на Галилео в Сан Франциско се е увеличил от 14 души през май до “повече от” 20 към днешна дата.