A Google bemutatta legújabb szövegbeágyazási modelljét, a gemini-embedding-exp-03-07-et, a Gemini API részeként, ami jelentős előrelépést jelent a természetes nyelvfeldolgozás területén. Ez a modell, amelyet 2025. március 7-én indítottak el, a Google belépését jelenti a Gemini beágyazások családjába, kihasználva a fejlett nyelvi megértési képességeket. Kísérleti kiadásként betekintést nyújt a beágyazási alkalmazások jövőjébe különböző területeken, a pénzügyektől a jogi elemzésig.
A gemini-embedding-exp-03-07 egyik kiemelkedő tulajdonsága, hogy képes 8000 bemeneti token kezelésére, ami jelentős növekedés az elődje, a text-embedding-004 által támogatott 3000 tokenhez képest. Ez a bővítés gazdagabb szövegreprezentációt tesz lehetővé, ami elengedhetetlen olyan összetett alkalmazásokhoz, mint a visszakeresés-bővített generálási (RAG) rendszerek és a többnyelvű dokumentum-visszakeresés. Emellett 3072 dimenziós vektorokat állít elő, ami észrevehetően nagyobb az előző 768 dimenziós vektoroknál, növelve a modell képességét a szemantikai árnyalatok megragadására. A Google Gemini kifinomult beszélgetési felületeivel ez az új modell várhatóan újradefiniálja a szövegbeágyazás területét.
8000 token kezelésével a gemini-embedding-exp-03-07 javítja a szövegreprezentációt 3072 dimenziós vektorokkal a gazdag szemantikai megragadáshoz.
A Google új modellje kiváló teljesítményt nyújt a beágyazási alkalmazásokban, amit az MTEB többnyelvű ranglistán elért 68,32-es átlagpontszáma is bizonyít, 5,81 ponttal megelőzve a következő versenytársat. Ez jelentős javulás a korábbi modellekhez képest, kiemelve a modell fejlett szemantikai megértési képességeit. A Matrjoska Reprezentációs Tanulás beépítése továbbá támogatja a hatékony vektortárolást a dimenzió csonkolás lehetővé tételével, így alkalmazkodva a különböző tárolási korlátokhoz.
A modellek összehasonlításakor a gemini-embedding-exp-03-07 több szempontból is felülmúlja a text-embedding-004-et, beleértve a többnyelvű támogatást, amely most már több mint 100 nyelvre terjed ki. Ez a bővítés megduplázza a korábbi modellek által kínált nyelvi támogatást, elősegítve a különböző területeken való alkalmazást a kódosztályozástól a jogi dokumentumok elemzéséig. Az AI terület gyorsan fejlődik, folyamatos innovációt igényelve.
Kísérleti státusza ellenére a modell nem igényel kiterjedt finomhangolást a csúcstechnológiás eredmények eléréséhez, kiemelve robusztusságát és azonnali integrációs potenciálját a meglévő rendszerekbe.
A modell Google ökoszisztémába való integrációját a Gemini API meglévő embed_content végpontja segíti, biztosítva a kompatibilitást olyan fejlesztői könyvtárakkal, mint az llm-gemini. Az előzetes fázis során azonban a hozzáférés korlátozott, sebességkorlátozással 5 kérés/perc és 100 kérés/nap mellett, Gemini API kulcs szükséges a használathoz.
A magas tárolási igények ellenére a dimenziószám miatt, a modell hatékony késleltetést és költségcsökkentést kínál, vonzó opcióvá téve a fejlesztők számára.
Ahogy a Google folyamatosan finomítja a gemini-embedding-exp-03-07-et, tervben van egy stabil, általános elérhetőségű kiadás, későbbi támogatással nagyobb bemeneti ablakokhoz és bővített többnyelvű képességekhez. Ez a modell nemcsak új standardot állít fel a szövegbeágyazásban, hanem erősíti a csúcstechnológiai megoldásokat kereső felhasználók összetartozás érzetét is.
References
- https://techcrunch.com/2025/03/07/google-debuts-a-new-gemini-based-text-embedding-model/
- https://developers.googleblog.com/id/gemini-embedding-state-of-the-art-text-embedding-via-the-gemini-api/
- https://simonwillison.net/2025/Mar/7/gemini-embeddings/
- https://blog.google/technology/ai/google-gemini-ai/
- https://developers.googleblog.com/en/gemini-embedding-text-model-now-available-gemini-api/