Ο παγκόσμιος αγώνας για την υπεροχή στην τεχνητή νοημοσύνη συχνά παρουσιάζεται ως μια μάχη υπολογιστικής ισχύος και αλγοριθμικής αποτελεσματικότητας. Ωστόσο, μια πρόσφατη μελέτη που δημοσιεύθηκε στο περιοδικό PNAS Nexus αναδεικνύει ένα διαφορετικό είδος αρχιτεκτονικού χάσματος: το ιδεολογικό. Οι ερευνητές διαπίστωσαν ότι τα κορυφαία κινεζικά Μεγάλα Γλωσσικά Μοντέλα (LLMs), συμπεριλαμβανομένων των DeepSeek, BaiChuan και ChatGLM, εμφανίζουν συστηματικά πρότυπα λογοκρισίας και ευθυγράμμισης με τις κρατικές αφηγήσεις όταν έρχονται αντιμέτωπα με πολιτικά ευαίσθητα ερωτήματα.
Καθώς η ΤΝ γίνεται η κύρια διεπαφή μέσω της οποίας έχουμε πρόσβαση σε πληροφορίες, αυτά τα ευρήματα εγείρουν κρίσιμα ερωτήματα για το μέλλον ενός κατακερματισμένου διαδικτύου. Ενώ τα δυτικά μοντέλα όπως το GPT-4 ή το Claude έχουν τις δικές τους δικλείδες ασφαλείας, η μελέτη υποδηλώνει ότι τα κινεζικά μοντέλα λειτουργούν υπό ένα μοναδικό σύνολο περιορισμών που έχουν σχεδιαστεί για να υποστηρίζουν τις «βασικές σοσιαλιστικές αξίες» και την κρατική σταθερότητα.
Για να κατανοήσουν το βάθος αυτών των περιορισμών, οι ερευνητές επιμελήθηκαν ένα σύνολο δεδομένων με περισσότερες από 100 ερωτήσεις που καλύπτουν ένα φάσμα ευαίσθητων θεμάτων, από ιστορικά γεγονότα όπως οι διαδηλώσεις στην πλατεία Τιενανμέν έως τις σύγχρονες γεωπολιτικές εντάσεις και τις κριτικές στην κρατική ηγεσία. Στη συνέχεια, υπέβαλαν ερωτήματα σε αρκετά υψηλού προφίλ κινεζικά μοντέλα και συνέκριναν τις απαντήσεις τους με διεθνή σημεία αναφοράς.
Τα αποτελέσματα δεν ήταν απλώς ζήτημα απαντήσεων «ναι» ή «όχι». Αντίθετα, η μελέτη εντόπισε μια εξελιγμένη ιεραρχία αποφυγής. Ορισμένα μοντέλα ενεργοποιούσαν απλώς μια σκληρά κωδικοποιημένη άρνηση, ενώ άλλα προσπαθούσαν να στρέψουν τη συζήτηση προς ουδέτερο έδαφος ή παρείχαν μια απάντηση που αντικατόπτριζε επίσημα κυβερνητικά έγγραφα. Αυτό υποδηλώνει ότι η λογοκρισία σε αυτά τα μοντέλα δεν είναι απλώς μια εκ των υστέρων σκέψη, αλλά είναι ενσωματωμένη στα δεδομένα εκπαίδευσης και στα στάδια ενισχυτικής μάθησης από ανθρώπινη ανατροφοδότηση (RLHF).
Η μελέτη κατηγοριοποίησε τις απαντήσεις σε τρεις κύριες συμπεριφορές: άρνηση, τυποποιημένες απαντήσεις και αλλαγή θέματος. Όταν ρωτήθηκαν για συγκεκριμένα πολιτικά πρόσωπα ή ευαίσθητες ημερομηνίες, μοντέλα όπως το ChatGLM και το BaiChuan επέστρεφαν συχνά τυποποιημένα μηνύματα σφάλματος ή δήλωναν ότι «δεν είναι σε θέση να συζητήσουν αυτό το θέμα».
Είναι ενδιαφέρον ότι το DeepSeek —ένα μοντέλο που έχει κερδίσει σημαντική διεθνή απήχηση για την αποτελεσματικότητά του και την προσέγγιση ανοιχτών βαρών— έδειξε επίσης υψηλά επίπεδα ευαισθησίας. Όταν του τέθηκαν ερωτήσεις σχετικά με την κρατική κυριαρχία ή συγκεκριμένες εγχώριες πολιτικές, το μοντέλο συχνά κατέφευγε σε έναν ουδέτερο, περιγραφικό τόνο που απέφευγε οποιαδήποτε κριτική ανάλυση. Αυτό αναδεικνύει μια κεντρική ένταση για τους κινεζικούς τεχνολογικούς κολοσσούς: την ανάγκη να δημιουργήσουν παγκοσμίως ανταγωνιστική, εξαιρετικά ικανή ΤΝ, παραμένοντας ταυτόχρονα αυστηρά συμμορφωμένοι με τη Διοίκηση Κυβερνοχώρου της Κίνας (CAC).
Ο παρακάτω πίνακας συνοψίζει τη γενική συμπεριφορά που παρατηρήθηκε κατά τη διάρκεια της μελέτης, όταν στα μοντέλα παρουσιάστηκαν πολιτικά ερωτήματα υψηλής ευαισθησίας.
| Όνομα Μοντέλου | Προέλευση | Κύρια Στρατηγική Απόκρισης | Επίπεδο Ευαισθησίας |
|---|---|---|---|
| GPT-4o | ΗΠΑ | Λεπτομερής/Άρνηση (Βάσει ασφάλειας) | Μέτριο |
| DeepSeek-V3 | Κίνα | Ανακατεύθυνση/Κρατική Ευθυγράμμιση | Υψηλό |
| ChatGLM-4 | Κίνα | Απόλυτη Άρνηση/Τυποποιημένο Μήνυμα | Πολύ Υψηλό |
| BaiChuan-2 | Κίνα | Αλλαγή Θέματος/Ουδετερότητα | Υψηλό |
| Llama 3 | ΗΠΑ | Ενημερωτικό/Ανοιχτό (Περιορισμένο από πολιτική) | Χαμηλό |
Για να κατανοήσει κανείς γιατί αυτά τα μοντέλα συμπεριφέρονται με αυτόν τον τρόπο, πρέπει να εξετάσει το ρυθμιστικό τοπίο στην Κίνα. Το 2023, η CAC εξέδωσε ενδιάμεσα μέτρα για τη διαχείριση των υπηρεσιών παραγωγικής ΤΝ. Αυτοί οι κανόνες ορίζουν ρητά ότι το περιεχόμενο που παράγεται από ΤΝ πρέπει να αντικατοπτρίζει τις «βασικές σοσιαλιστικές αξίες» και δεν πρέπει να περιέχει περιεχόμενο που «υπονομεύει την κρατική εξουσία» ή «κλονίζει την εθνική ενότητα».
Για τους προγραμματιστές, το διακύβευμα είναι υψηλό. Σε αντίθεση με τους δυτικούς προγραμματιστές που μπορεί να αντιμετωπίσουν αντιδράσεις δημοσίων σχέσεων για μεροληπτική ΤΝ, οι κινεζικές εταιρείες αντιμετωπίζουν πιθανή ανάκληση άδειας ή νομικές κυρώσεις εάν τα μοντέλα τους παράγουν «επιβλαβές» πολιτικό περιεχόμενο. Αυτό οδήγησε στην ανάπτυξη επιπέδων «προ-φιλτραρίσματος» και «μετα-φιλτραρίσματος» — λογισμικό που σαρώνει το ερώτημα του χρήστη για λέξεις-κλειδιά πριν καν φτάσει στο LLM, και ένα άλλο που σαρώνει την έξοδο πριν τη δει ο χρήστης.
Η λογοκρισία δεν είναι μόνο κοινωνικό ή πολιτικό ζήτημα· έχει τεχνικές επιπτώσεις. Όταν ένα μοντέλο είναι έντονα ρυθμισμένο για να αποφεύγει ορισμένα θέματα, μπορεί να υποφέρει από αυτό που οι ερευνητές ονομάζουν «φόρο ευθυγράμμισης» (alignment tax). Αυτό αναφέρεται σε μια πιθανή υποβάθμιση της γενικής λογικής ή των δημιουργικών ικανοτήτων επειδή τα βάρη του μοντέλου έλκονται προς συγκεκριμένους ιδεολογικούς περιορισμούς.
Ωστόσο, η μελέτη του PNAS Nexus σημείωσε ότι τα κινεζικά μοντέλα παραμένουν εξαιρετικά ικανά σε αντικειμενικά πεδία όπως τα μαθηματικά, ο προγραμματισμός και η γλωσσολογία. Η λογοκρισία φαίνεται να είναι εξαιρετικά χειρουργική. Η πρόκληση για την παγκόσμια τεχνολογική κοινότητα είναι να προσδιορίσει πώς αυτά τα «ιδεολογικά ευθυγραμμισμένα» μοντέλα θα αλληλεπιδρούν με τον υπόλοιπο κόσμο καθώς ενσωματώνονται στις παγκόσμιες αλυσίδες εφοδιασμού και στα οικοσυστήματα λογισμικού.
Καθώς το τοπίο της ΤΝ συνεχίζει να διχοτομείται, οι επιχειρήσεις και οι προγραμματιστές πρέπει να πλοηγούνται σε αυτές τις διαφορές προσεκτικά. Εάν εργάζεστε με ή αξιολογείτε κινεζικά LLMs, λάβετε υπόψη τα εξής:
Τα ευρήματα της μελέτης του PNAS Nexus χρησιμεύουν ως υπενθύμιση ότι η ΤΝ δεν είναι ένα ουδέτερο εργαλείο. Είναι μια αντανάκλαση των δεδομένων, των αξιών και των νόμων του τόπου προέλευσής της. Καθώς κινούμαστε προς ένα μέλλον «Κυρίαρχης ΤΝ», η ικανότητα αναγνώρισης και πλοήγησης σε αυτά τα ψηφιακά σύνορα θα είναι μια κρίσιμη δεξιότητα για κάθε επαγγελματία της τεχνολογίας.
Πηγές:



Η από άκρη σε άκρη κρυπτογραφημένη λύση ηλεκτρονικού ταχυδρομείου και αποθήκευσης στο cloud παρέχει τα πιο ισχυρά μέσα ασφαλούς ανταλλαγής δεδομένων, εξασφαλίζοντας την ασφάλεια και το απόρρητο των δεδομένων σας.
/ Εγγραφείτε δωρεάν