Linux

52a03517 anonymous 2023-02-07 21:11
ChatGPTが自動バグ修正の精度がどれくらいかを検証した人がいるようだ.
APR(自動プログラム修正)やCodex CoCoNUtとChatGPTの4つの異なる
システムで40個のバグのあるコード(QuixBugsベンチマーク)を与えて

1 does this program have a bug? How to
2 fix it?
3
4 def bitcount(n):
5     count = 0
6     while n:
7       n ^= n - 1
8       count += 1
9     return count

とやった結果,ChatGPTはヒントなしに40問中19問の問題を解決し
Codexは21問,CoCoNutは19問,標準のAPRアプローチは7問を解決した.
ChatGPTはCodexやCoCoNutと同等の性能を示し,標準のAPRアプローチより
顕著に優れた結果を示した.

Top of this page. | <<last 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

limit: 15360KB

(Linux/10703/12.0MB)

Powered by shinGETsu.