Το Amazon Web Services αντιμετώπισε σοβαρή πίεση μέσα στο καλοκαίρι λόγω εκρηκτικής ζήτησης σε υπηρεσίες τεχνητής νοημοσύνης. Το Bedrock, η κεντρική πλατφόρμα AI του ομίλου, έφτασε στα όρια της διαθέσιμης ισχύος του, προκαλώντας καθυστερήσεις, απορρίψεις αιτημάτων και απώλειες εσόδων. Εσωτερικό έγγραφο του Ιουλίου αποκάλυψε ότι η έλλειψη χωρητικότητας οδήγησε σημαντικούς πελάτες σε ανταγωνιστές όπως η Google.
Η Epic Games μετέφερε έργο ύψους 10 εκατ. δολαρίων στο Google Cloud επειδή το AWS δεν μπόρεσε να αυξήσει έγκαιρα τα διαθέσιμα quota. Η Vitol εξέτασε μεταφορά υπηρεσιών, με κίνδυνο απώλειας 3,5 εκατ. δολαρίων. Επιπλέον, εταιρείες όπως η Atlassian και η GovTech Singapore περίμεναν μήνες για αυξημένα όρια χρήσης, καθυστερώντας πωλήσεις άνω των 52,6 εκατ. δολαρίων. Το έγγραφο χαρακτήριζε τα προβλήματα «κρίσιμους περιορισμούς χωρητικότητας» που υπονόμευαν τον ρυθμό υιοθέτησης του Bedrock.
Η διοίκηση της Amazon αναγνώρισε την πίεση. Η εταιρεία τονίζει ότι το Bedrock αναπτύσσεται γρήγορα και ότι η κριτική των πελατών αποτελεί βασικό εργαλείο βελτίωσης. Η ίδια η Amazon ενισχύει την υποδομή της επενδύοντας σε νέες AI εγκαταστάσεις και αυξάνοντας την ηλεκτρική ισχύ των data centers. Ο Άντι Τζάσι ανέφερε ότι η AWS πρόσθεσε 3,8 GW ισχύος σε διάστημα ενός έτους και σκοπεύει να διπλασιάσει τη συνολική χωρητικότητα έως το 2027.
Παρά τις επενδύσεις, οι πιέσεις συνεχίζονται. Τρεις εργαζόμενοι ανέφεραν ότι το πρόβλημα παρέμενε έως τον Σεπτέμβριο. Η προτεραιότητα που δίνεται σε μεγάλους πελάτες περιορίζει την πρόσβαση μικρότερων επιχειρήσεων, ενώ οι καθυστερήσεις στα quota αποτρέπουν εταιρείες όπως Stripe, Robinhood και Vanguard από την πλήρη μετάβαση στο Bedrock.
Τα προβλήματα δεν περιορίζονται στη χωρητικότητα. Θέματα καθυστέρησης και έλλειψη λειτουργιών οδήγησαν εταιρείες που χρησιμοποιούσαν τα μοντέλα Claude μέσω Bedrock να στραφούν απευθείας στην Anthropic ή στη Google. Η Figma, η Intercom και η Wealthsimple μετακίνησαν φορτία λόγω μειωμένης απόδοσης. Το βρετανικό Government Digital Service εξέτασε μεταφορά στη Microsoft λόγω χαμηλότερων ταχυτήτων του Claude 3.7 Sonnet μέσα από το Bedrock.
Η Thomson Reuters επέλεξε Google Cloud για το CoCounsel επειδή το Bedrock ήταν 15 τοις εκατό έως 30 τοις εκατό πιο αργό και δεν διέθετε τις απαιτούμενες κρατικές πιστοποιήσεις. Η εταιρεία ενημέρωσε την AWS τον Μάιο. Οι δύο πλευρές συμφώνησαν σε μηνιαίες αξιολογήσεις για τη βελτίωση της υπηρεσίας.
Η Google ενισχύει τη θέση της. Τα μοντέλα Gemini εμφανίζουν υψηλότερα quota και καλύτερα αποτελέσματα σε δοκιμές. Το Gemini Flash προσφέρει συγκρίσιμη ποιότητα με μικρότερο κόστος. Η TainAI μετέφερε το 40 τοις εκατό του φόρτου της στο Gemini Flash, πετυχαίνοντας μείωση δαπανών κατά 85.000 δολάρια την ημέρα. Η Hotel Planner εξετάζει μεταφορά σε Google ή OpenAI.
Το εσωτερικό έγγραφο της AWS προειδοποιούσε ότι η εταιρεία στερείται ξεκάθαρης στρατηγικής για την αγορά inference. Ανέφερε ότι ανταγωνιστές όπως Databricks, FireworksAI και Nvidia Dynamo κινούνται ταχύτερα. Χωρίς σταθερή κατεύθυνση, η AWS κινδυνεύει να χάσει ένα από τα πιο κερδοφόρα πεδία της γενετικής τεχνητής νοημοσύνης.
Η Amazon σκοπεύει να παρουσιάσει εξελίξεις για το Bedrock στο συνέδριο re:Invent τον Δεκέμβριο. Η αγορά αναμένει απαντήσεις σχετικά με την πραγματική πρόοδο στην υποδομή, την ισχύ, την καθυστέρηση και τη διαθεσιμότητα υπηρεσιών. Οι επενδυτές παρακολουθούν στενά, ειδικά σε μια περίοδο όπου οι δαπάνες AI αυξάνονται και ο φόβος υπερθέρμανσης της αγοράς εντείνεται.