Εγγραφείτε στα καθημερινά και εβδομαδιαία ενημερωτικά δελτία μας για τις πιο πρόσφατες ενημερώσεις και αποκλειστικό περιεχόμενο σχετικά με την κορυφαία στον κλάδο κάλυψη τεχνητής νοημοσύνης. Μάθετε περισσότερα


Αποδεικνύοντας την πρόθεσή της να υποστηρίξει ένα ευρύ φάσμα περιπτώσεων εταιρικής χρήσης — συμπεριλαμβανομένων εκείνων που δεν απαιτούν ακριβά μοντέλα μεγάλων γλωσσών (LLMs) με ένταση πόρων — εκκίνηση AI Διατηρώ συνέπεια κυκλοφόρησε το Command R7B, το μικρότερο και ταχύτερο στη σειρά μοντέλων R.

Το Command R7B έχει κατασκευαστεί για να υποστηρίζει γρήγορη δημιουργία πρωτοτύπων και επανάληψη και χρησιμοποιεί επαυξημένη παραγωγή ανάκτησης (RAG) για να βελτιώσει την ακρίβειά του. Το μοντέλο διαθέτει μήκος περιβάλλοντος 128K και υποστηρίζει 23 γλώσσες. Ξεπερνά τα άλλα στην κατηγορία των μοντέλων ανοιχτού βάρους – Gemma της Google, Meta’s Llama, Mistral’s Ministral – σε εργασίες όπως μαθηματικά και κωδικοποίηση, λέει ο Cohere.

“Το μοντέλο έχει σχεδιαστεί για προγραμματιστές και επιχειρήσεις που πρέπει να βελτιστοποιήσουν την ταχύτητα, την απόδοση κόστους και τους υπολογιστικούς πόρους των περιπτώσεων χρήσης τους”, ο συνιδρυτής και διευθύνων σύμβουλος της Cohere, Aidan Gomez. γράφει σε ανάρτηση ιστολογίου ανακοινώνει το νέο μοντέλο.

Ξεπερνούν τους ανταγωνιστές σε μαθηματικά, κωδικοποίηση, RAG

Το Cohere έχει επικεντρωθεί στρατηγικά στις επιχειρήσεις και τις μοναδικές περιπτώσεις χρήσης τους. Η εταιρεία παρουσίασε Command-R τον Μάρτιο και το πανίσχυρο Command R+ τον Απρίλιο, και έχει κάνει αναβαθμίσεις όλο το χρόνο για υποστήριξη της ταχύτητας και της αποτελεσματικότητας. Πείραξε το Command R7B ως το «τελικό» μοντέλο της σειράς R και λέει ότι θα απελευθερώσει τα βάρη μοντέλων στην ερευνητική κοινότητα της τεχνητής νοημοσύνης.

Ο Cohere σημείωσε ότι ένας κρίσιμος τομέας εστίασης κατά την ανάπτυξη του Command R7B ήταν η βελτίωση της απόδοσης στα μαθηματικά, τη λογική, τον κώδικα και τη μετάφραση. Η εταιρεία φαίνεται να έχει πετύχει σε αυτούς τους τομείς, με το νέο μικρότερο μοντέλο να βρίσκεται στην κορυφή HuggingFace Open LLM Leaderboard έναντι μοντέλων ανοιχτού βάρους παρόμοιου μεγέθους, συμπεριλαμβανομένων των Gemma 2 9B, Ministral 8B και Llama 3.1 8B.

Επιπλέον, το μικρότερο μοντέλο της σειράς R ξεπερνά τα ανταγωνιστικά μοντέλα σε τομείς όπως οι πράκτορες AI, η χρήση εργαλείων και το RAG, κάτι που συμβάλλει στη βελτίωση της ακρίβειας γειώνοντας τις εξόδους του μοντέλου σε εξωτερικά δεδομένα. Ο Cohere λέει ότι το Command R7B υπερέχει σε εργασίες συνομιλίας, συμπεριλαμβανομένης της βοήθειας στον χώρο εργασίας τεχνολογίας και διαχείρισης επιχειρηματικού κινδύνου (ERM). τεχνικά στοιχεία· υποστήριξη στο χώρο εργασίας των μέσων ενημέρωσης και εξυπηρέτησης πελατών· Συχνές ερωτήσεις ανθρώπινου δυναμικού; και περίληψη. Ο Cohere σημειώνει επίσης ότι το μοντέλο είναι «εξαιρετικά καλό» στην ανάκτηση και το χειρισμό αριθμητικών πληροφοριών σε χρηματοοικονομικές ρυθμίσεις.

Συνολικά, το Command R7B κατέλαβε την πρώτη θέση, κατά μέσο όρο, σε σημαντικά σημεία αναφοράς, συμπεριλαμβανομένης της αξιολόγησης μετά από οδηγίες (IFeval). μεγάλος πάγκος σκληρός (BBH); μεταπτυχιακού επιπέδου Google-proof Q&A (GPQA). μαλακός συλλογισμός πολλαπλών βημάτων (MuSR); και μαζική κατανόηση γλώσσας πολλαπλών εργασιών (MMLU).

Αφαίρεση περιττών λειτουργιών κλήσης

Το Command R7B μπορεί να χρησιμοποιήσει εργαλεία όπως μηχανές αναζήτησης, API και διανυσματικές βάσεις δεδομένων για να επεκτείνει τη λειτουργικότητά του. Η Cohere αναφέρει ότι η χρήση εργαλείων του μοντέλου έχει ισχυρή απόδοση έναντι των ανταγωνιστών στο Leaderboard του Berkeley Function-Calling, ο οποίος αξιολογεί την ακρίβεια ενός μοντέλου στην κλήση συναρτήσεων (σύνδεση με εξωτερικά δεδομένα και συστήματα).

Ο Gomez επισημαίνει ότι αυτό αποδεικνύει την αποτελεσματικότητά του σε «πραγματικά, διαφορετικά και δυναμικά περιβάλλοντα» και καταργεί την ανάγκη για περιττές λειτουργίες κλήσης. Αυτό μπορεί να το κάνει μια καλή επιλογή για τη δημιουργία «γρήγορων και ικανών» πρακτόρων AI. Για παράδειγμα, επισημαίνει ο Cohere, όταν λειτουργεί ως πράκτορας επαυξημένης αναζήτησης στο Διαδίκτυο, το Command R7B μπορεί να αναλύσει σύνθετες ερωτήσεις σε υποστόχους, ενώ έχει επίσης καλή απόδοση με προηγμένη συλλογιστική και ανάκτηση πληροφοριών.

Επειδή είναι μικρό, το Command R7B μπορεί να αναπτυχθεί σε CPU, GPU και MacBook χαμηλού επιπέδου και καταναλωτών, επιτρέποντας συμπεράσματα στη συσκευή. Το μοντέλο είναι τώρα διαθέσιμο στην πλατφόρμα Cohere και στο HuggingFace. Η τιμολόγηση είναι 0,0375 $ ανά 1 εκατομμύριο διακριτικά εισόδου και 0,15 $ ανά 1 εκατομμύριο μάρκες εξόδου.

«Είναι μια ιδανική επιλογή για επιχειρήσεις που αναζητούν ένα οικονομικά αποδοτικό μοντέλο βασισμένο στα εσωτερικά τους έγγραφα και δεδομένα», γράφει ο Gomez.

https://venturebeat.com/ai/coheres-smallest-fastest-r-series-model-excels-at-rag-reasoning-in-23-languages/