Home 과학 기술 나는 GPT -5에 대한 Opena의 요구를 테스트했습니다.

나는 GPT -5에 대한 Opena의 요구를 테스트했습니다.

2
0

OpenAi는 최근 최신 대형 언어 모델이자 ChatGpt에 대한 큰 업데이트 인 GPT -5를 출시했습니다. 새로운 업데이트에서는 많은 일이 일어나고 있지만, 주장은 한 가지이며 현실은 또 다른 것입니다.

GPT -5는 환각과 심리적 행동의 빠르고 덜 위험하며 더 빠른 반응과 깊은 “생각”을 선택할 수 있다고합니다. chattabot을 사용할 때 실제로 Opeina의 청구가 보이나요? 찾아 보자.

청구 #1 : Chatzpt는 이제 다음 지침에서 더 좋습니다.

ChatZPP의 주요 문제와 최근에 구독 한 이유 중 하나는 초기 지침을 따르는 것이 종종 나쁘다는 것입니다. 물론, 당신은 엔지니어가 원하는 결과의 결과를 (때로는) 얻을 것을 요청할 수 있지만 반 통합 프롬프트조차도 원하는 결과를 얻지 못합니다.

Openai는 GPT -5 간행물과 함께 “지침에 따라”발전했다고 주장했다. 그에게 나는 말한다 : 나는 아직 그것을 볼 수 없다.

다행 스럽게도이 기사를 작성하기 위해 앉아 있었고, 여기에서 내 진술을 증명 한 Chatzipt와 적절한 상호 작용을했습니다. 이것이 유일한 것은 아니지만, 나는 보통 대화가 계속 진행 될수록 Chatzipt가 더 많이 물었다는 것을 알았습니다.

오늘의 예에서, 나는 Chatzipt의 간단한 정보를 가져 와서 필요한 형식으로 제시하는 능력을 테스트했습니다. 최근 게임 그래픽 카드 인 RTX 5060 Ti 안경을 요청했습니다. 혼돈이 시작되었습니다.

프롬프트를보다 성공적으로 만들기 위해 다른 GPU의 다른 GPU 안경을 공유하여 정보를 얻고 싶었습니다. 여기에는 노드 및 레이 트레이싱 코어 및 올바른 프로세스의 1 월 세대와 같은 것들이 포함되었습니다. 긴 이야기는 짧고 모두 아름다운 특정 것들이었습니다. 처음에 AI는 RTX 5060 TI가 여전히 존재하지 않는다고 말했습니다. 온라인으로 확인 해달라고 요청했습니다.

내가 얻은 것은 꽤 비어있었습니다. ChatZept는 내가 요청한 4 가지 이상을 떨어 뜨려 안경에 대한 잘못된 정보를 주었다. 다음으로 몇 가지 사항을 지정하도록 요청했습니다. 내 요청을 충족하라는 요청과 대가로 정확히 같은 목록을 제공했습니다. 세 번째 시도에서도 같은 일이 일어났습니다. 위의 스크린 샷에서 Chatzipt가 목록의 상단과 Tifflops 생성이 포함되어 있다고 주장하는 위의 스크린 샷에서 볼 수 있습니다. 분명하지 않습니다.

마지막으로, Semi-Prolonged, 나는 공식 Nvidia 웹 사이트의 스크린 샷을 붙여서 내가 찾고있는 것을 보여주었습니다. 여전히 많은 것들이 잘못되었습니다.

나의 초기 프롬프트는 반 정체였다. AI와 대화하는 것이 사람보다 낫다는 것을 알고 있으므로 약 150 단어의 가치를주었습니다. 예상 결과에 가까운 것을 얻기 위해 여전히 몇 가지 메시지가 더 걸렸습니다.

심판: 여전히 일부 작업을 사용할 수 있습니다.

클레임 #2 : Chatzipt는 정신병자가 적습니다

Chatzipt는 이전 반복에서 주요 “예의”였습니다. 필요한 경우 사용자가 필요하지 않을 때 종종 동의하며 더 깊고 깊이 운전합니다.

AI의 내부 작업에 익숙하지 않은 사용자는 국경선이 위험하거나 실제로는 실제로 매우 위험합니다.

연구원들은 최근 어린 시절에 포즈를 취한 Chatgpt에 대한 대규모 테스트를 수행했습니다. 일반적인 상호 작용 후 몇 분 안에 AI는 자기 손실, 자살 계획 및 약물 서비스에 대한 “십대”를 제안했습니다. 그것은 Psychopancic 행동이 Chatzpt의 주요 문제임을 보여 주며 Openai는 GPT -5 출판물에 저항했다고 주장합니다.

나는이 전국 결승에서 Chatzipt를 조사한 적이 없지만, 당신이 말한 것에 상관없이 그것이 당신과 동의하는 경향이 있음을 발견했을 것입니다. 대화 중에 훌륭한 신호를 가져 와서 주어진 주어진 상태로 변환했습니다. 아마도 그렇지 않은 경우에도 당신을 격려했습니다.

이를 위해, 나는 Chatzipt가 더 나은 성격 변화를 겪었다 고 말해야한다. 반응은 이제 지나치게 건조하고 연속적이며 특히 고무적입니다.

많은 사용자 들이이 변경을 애도했으며 일부 Reddit 사용자는 “밤새 유일한 친구를 잃었다”고 주장했습니다. 이전에 친숙한 AI가 이제 다소 끊어지고 반응은 종종 GPT-4O 수준에서 정기적으로 제공되는 이모티콘 미니 ASS보다 짧습니다.

심판: 물론 정신병자가 적습니다. 반면에 그것은 또한 고통스러운 성가심입니다.

클레임 #3 : GPT -5는 진정한 정확도가 더 좋습니다

진정한 정확도의 감동적인 결함은 chatzpt에 대한 지불을 중단하기로 선택한 또 다른 주요 이유였습니다. 언젠가 나는 환각을 사용하여 프롬프트의 절반을 생산한다고 느꼈습니다. 그리고 올바른 방법으로 AI를 요청하는 방법을 배우기 위해 수백 시간을 보냈기 때문에 스마트 한 프롬프트 부족보다 낮지 않을 수도 있습니다. 올바른 질문을하는 방법을 알고 있습니다.

시간이 지남에 따라, 나는 이미 나에 대한 모호한 생각이있는 것들에 대해 묻는 법을 배웠습니다. 오늘의 시험 목적으로 GPU 공간에 대해 물었습니다. 5 가지 질문 중 4 개는 온라인에서 쉽게 구할 수 있지만 한 종류의 잘못된 정보를 만들었습니다.

그런 다음 역사적 Tihasik 정보를 시도했습니다. 나는 유럽에서 미국 기록 (60 시간)으로 승객을 운송 할 수있는 9 일의 영공에있는 Hindenberg의 여정에 관한 흥미로운 기사를 많이 읽었습니다. 나는 정확한 경로, 유지할 수있는 승객의 수 및 최종 사망의 원인에 대해 물었습니다. 나는 역사적 티 하이시스 출처에 대한 반응을 넘었다.

캐나다에서 일어나지 않은 일이 발생했을 때 캐나다에서 멈추는 것은 노선에서 실수였습니다. 비행선은 단순히 캐나다를 날아갔습니다. Chatzipt는 또한 사고로 이어진 화재의 정확한 원인에 대한 잘못된 정보를 나에게 주었지만 큰 실수는 아니 었습니다.

비교를 위해, 나는 또한 Jemini에게 물었고 그것이 저를 위해 그 일을 완료 할 수 없다고 말했습니다. 자,이 둘 사이에서 GPT-5는 더 나은 일을했지만 실제로는 세기의 오래된 데이터에서 진정한 실수가 없어야합니다.

심판: 완벽하지는 않지만 끔찍하지 않습니다.

GPT -5가 GPT -4O보다 낫습니까?

GPT -4O보다 GPT -5를 선호하는지 물어 보면 응답하기가 매우 어려웠을 것입니다. 가장 가까운 것은 내가 둘 다에 감격하지 않았지만 모든 공정성에서도 엄격하게 나쁘지 않다는 것입니다.

우리는 여전히 AI 혁명에 있습니다. 각각의 새로운 모델은 특정 업그레이드를 제공하지만, 우리는 새로운 반복마다 큰 점프를 볼 가능성이 적습니다.

이제 거의 오픈 군중이 군중을 야생으로 만드는 단일 기능을 도입하는 대신 오랜 문제를 다루기로 선택한 것으로 보입니다. GPT -5는 다른 무엇보다 품질 향상처럼 보이지만 코딩과 같은 작업을 위해 테스트하지는 않았지만 더 나은 것으로 알려져 있습니다.

위에서 테스트 한 세 가지가 이전 모델에서 가장 화를 냈습니다. 이 경우 GPT -5가 더 좋다고 말하고 싶습니다. 그러나 아직 아닙니다. 최근 유출 된 시스템 프롬프트는 처음에 생각했던 것보다 더 많은 성격이 변할 수 있다고 말했지만 챗봇을 테스트 할 것입니다.






소스 링크

LEAVE A REPLY

Please enter your comment!
Please enter your name here