24HourWire

24HourWire

News from all angles

Хабр Center

Почему бенчмарки в AI сломались — и что с этим делать в понедельник

Числовая оценка идеальна для закрытых задач. Аморфная нужна для открытых. AI за пятнадцать лет переехал из первого класса во второй — а инструмент оценки остался прежним. В условиях высокого темпа эт…

Redirecting to Хабр in 3 seconds...

Read Now → Explore 24HourWire

Share this story with your network