자유포럼

자유포럼 게시판은 글작성시 포인트 500점을 드립니다. (댓글 100점)

이번에 발표된 제미나이 3.5 벤치마크 점수

가가매루 0 4 0 0 05.21

[요약]
1. 플래시(경량) 모델인데도 GPT-5.5, Claude Opus 4.7 같은 상위 모델들이랑 어깨를 나란히 함

2.에이전트(MCP Atlas 83.6%, Toolathlon 56.5%), 멀티모달(CharXiv 84.2%, MMMU-Pro 83.6%), 금융 추론(Finance Agent v2 57.9%) 등에서 1등 차지

3. 코딩이랑 고난도 추론(ARC-AGI-2, Humanity's Last Exam)은 GPT-5.5/Opus 4.7한테 밀리지만, Flash 모델이라는 점 감안하면 가성비 미친 수준


0		0

0 Comments

로그인한 회원만 댓글 등록이 가능합니다.

이전 다음 목록

주간베스트
월간베스트

번호 포토 제목 이름 날짜 조회 추천 비추

27550

넷플릭스, 원더풀스 볼만한가유? ;;;;
가가매루 0 5 0 0 05.21

가가매루

05.21

5

0

0
27549

고구마 먹인 비단털돼지
whn98 0 12 0 0 05.19

whn98

05.19

12

0

0
27548

답지 베끼다가 서울대 간 사연
whn98 0 13 0 0 05.19

whn98

05.19

13

0

0
27547

스페인 사람이 느끼는 일본문화
whn98 0 11 0 0 05.19

whn98

05.19

11

0

0
27546

레고 이브이로 만들 수 있는 것
whn98 0 13 0 0 05.19

whn98

05.19

13

0

0
27545

강동원이 옛날 아이돌로 나오는 영화 시사회 평점 근황
whn98 0 13 0 0 05.19

whn98

05.19

13

0

0
27544

모 고등학교 축제에서 논란이라는 장면
whn98 0 12 0 0 05.19

whn98

05.19

12

0

0
27543

한국 시어머니와 프랑스 며느리의 무시무시한 고부갈등
whn98 0 12 0 0 05.19

whn98

05.19

12

0

0
27542

배우려는 사람들이 없어서 사라지는 기술
whn98 0 13 0 0 05.19

whn98

05.19

13

0

0
27541

스마트폰 중독 테스트...
whn98 0 13 0 0 05.19

whn98

05.19

13

0

0
27540

업계탑이 알려주는 연예인 번아웃 치료법
whn98 0 16 0 0 05.19

whn98

05.19

16

0

0
27539

대한민국 도시별 인구순위
whn98 0 15 0 0 05.19

whn98

05.19

15

0

0
27538

오늘자 스타벅스 상황 비유
whn98 0 16 0 0 05.19

whn98

05.19

16

0

0
27537

축복받은 우리나라만의 천연자원
whn98 0 14 0 0 05.19

whn98

05.19

14

0

0
27536

한국인이 가장많이 이용하는 이커머스 앱 순위
whn98 0 13 0 0 05.19

whn98

05.19

13

0

0
27535

탈모 관리가 필요없는 이유
whn98 0 15 0 0 05.19

whn98

05.19

15

0

0
27534

물타기 하다가 대주주된 놈 근황
whn98 0 13 0 0 05.19

whn98

05.19

13

0

0
27533

딸이 AV 찍는 걸 알았을 때 부모 반응
whn98 0 14 0 0 05.19

whn98

05.19

14

0

0
27532

중국 공산당이 천안문 민주화운동을 폭동으로 왜곡시킨 방법
whn98 0 14 0 0 05.19

whn98

05.19

14

0

0
27531

100일후 출하 당하는 만화가
whn98 0 13 0 0 05.19

whn98

05.19

13

0

0

정렬

검색

+ 새글

+ 댓글

State

팝업레이어 알림

이번에 발표된 제미나이 3.5 벤치마크 점수