国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

ChatSQL:賦能ChatGPT實現純文本創建SQL查詢

譯文
人工智能
ChatGPT于2020年6月發布,由OpenAI開發。它已促使許多領域迎來了革命性變化。其中一個領域就是創建數據庫查詢。數據庫查詢可以通過ChatGPT由純文本生成。它可以幫助您了解您不甚了解的數據庫。

譯者 | 布加迪

審校 | 重樓

ChatGPT20206月發布,由OpenAI開發。它已促使許多領域迎來了革命性變化。其中一個領域就是創建數據庫查詢。數據庫查詢可以通過ChatGPT純文本生成。它可以幫助您了解您不了解的數據庫。

隨著ChatGPT大行其道,人工智能已經逐漸融入我們的日常生活當中,并且發展勢頭正猛。在切入正題之前,不妨先簡單探究一下ChatGPT。

為了充分理解ChatGPT的功能,有必要充分掌握其底層架構。ChatGPT是基于GPT架構開發的。因此不妨先看看Transformer。

要直接訪問該項目,請點擊這里https://github.com/ademakdogan/ChatSQL?ref=hackernoon.com。

圖1. 來自Transformer的編碼器和解碼器圖1. 來自Transformer的編碼器和解碼器

Transformer使用seq2seq框架,從而能夠將一個序列轉換另一個序列。序列定義了排序。舉例來說,我們可以將句子看作是一連串單詞。Transformer還可以用于解決文本翻譯之類的自然語言處理(NLP)問題。我們需要大量的標記數據來訓練這個架構。這對Transformer來說很難學習。我們可以使用遷移學習來解決這個問題。Transformer由兩個部分組成(見1):編碼器和解碼器,它們都擅長獲得熟練的語言表示。

這種熟練程度使我們能夠從每個部分構建語言模型。通過堆疊編碼器,我們獲得Transformer的雙向編碼器表示通常稱為BERT。與之相似,通過堆疊解碼器單元,我們可以獲得生成式預訓練(即GPT。在本文這個例子中,我們關注GPT。不妨在GPT的背景下考慮遷移學習。當我們從頭開始訓練一個模型時,它通常需要數量龐大的數據,因為參數最初是隨機設置的。然而,想象一下這樣一個場景參數偶然與我們需要的值一致或相對齊。在這種情況下,我們不需要一個廣泛的數據集來獲得我們想要的結果。正如我們所理解,BERTGPT用于遷移學習概念中。

因此,GPT訓練分為兩個部分。一個是預訓練部分,我們訓練GPT架構理解語言是什么;另一個是微調部分,我們使用遷移學習來進一步訓練GPT架構,使其針對特定的語言任務表現良好

圖2. 示例性的下一個單詞預測圖2. 示例性的下一個單詞預測

GPT有一種結構,可以將隨機單詞序列作為輸入,并預測下一個最合適的單詞。示例性預測如圖2所示。

語言建模被選為理解語言基本方面的一個理想基礎,而且很容易進行微調。它通常被稱為自監督任務,因為句子本身同時可以充當輸入標簽和輸出標簽。

圖3. ChatGPT示意圖圖3. ChatGPT示意圖

不妨繼續討論ChatGPT。如圖3所示,整個ChatGPT過程可以分為三個主要步驟。在第一步中,使用GPT模型,該模型已針對理解語言本身進行了預訓練。下一步涉及對模型進行微調,以便有效地處理用戶提示,并根據這些提示生成適當的響應。為了方便這過程,標記員獲得標記數據;這些標記員不僅提供提示,還為每個提示指定所需的響應。這便于GPT模型進行監督微調,因為既有輸入提示,有相應的輸出響應。

下一步中,使用從第一步獲得的監督微調模型。單個提示通過模型傳遞,并生成多個響應。然后,標記人員對這些響應的質量進行評估和評定。每個生成的響應都被分配一個相應的獎勵,這個獎勵被用來訓練另一個GPT模型獎勵模型。獎勵模型本身就是一個模型,其功能是將初始提示和其中一個響應作為輸入,生成獎勵作為輸出。這種獎勵量化了響應的質量或好壞。

在第三步中,一個看不見的提示將被拿來通過監督微調模型的復制品來傳遞。這將生成響應,然后使用獎勵模型來評估響應的等級或質量。獲得的等級用于進一步完善我們已經微調過的模型。這通過將等級合并PPO模型的損失函數中來實現,允許通過反向傳播更新模型的參數。特別吸引人的地方是,這個過程不僅幫助模型表現出無害的行為,使它能夠生成實際的響應。這是由于獎勵本身是基于響應的質量而生成的。

ChatSQL

現在不妨使用Python借助ChatGPT創建一個項目。項目使用了LangChain框架。

我們的目標是使用純文本從數據庫檢索信息。為此,我們使用MySQL作為目標數據庫。然而,這種方法也可以用于在其他數據庫上生成查詢。示例數據庫如下所示。

所有代碼都可以在這里找到https://github.com/ademakdogan/ChatSQL

+-----+--------------------------------------------------------+------------------------+-------------------+--------+------------------+
| ID  | Title                                                  | Author                 | Genre             | Height | Publisher        |
+-----+--------------------------------------------------------+------------------------+-------------------+--------+------------------+
|   1 | Fundamentals of Wavelets                               | Goswami, Jaideva       | signal_processing |    228 | Wiley            |
|   2 | Data Smart                                           | Foreman, John          | data_science      |   235 | Wiley            |
|   3 | God Created the Integers                                | Hawking, Stephen       | mathematics       |  197 | Penguin          |
|   4 | Superfreakonomics                                     | Dubner, Stephen        | economics         |  179 | HarperCollins    |
|   5 | Orientalism                                           | Said, Edward           | history           |   197 | Penguin          |
|   6 | Nature of Statistical Learning Theory, The                  | Vapnik, Vladimir       | data_science      |    230 | Springer         |
|   7 | Integration of the Indian States                           | Menon, V P             | history           |    217 | Orient Blackswan |
|   8 | Drunkard's Walk, The                                  | Mlodinow, Leonard      | science           |   197 | Penguin          |
|   9 | Image Processing & Mathematical Morphology             | Shih, Frank            | signal_processing |     241 | CRC              |
|  10 | How to Think Like Sherlock Holmes                      | Konnikova, Maria       | psychology        |   240 | Penguin          |
|  11 | Data Scientists at Work                                 | Sebastian Gutierrez    | data_science      |     230 | Apress           |
|  12 | Slaughterhouse Five                                    | Vonnegut, Kurt         | fiction           |    198 | Random House     |
|  13 | Birth of a Theorem                                     | Villani, Cedric        | mathematics       |   234 | Bodley Head      |
|  14 | Structure & Interpretation of Computer Programs             | Sussman, Gerald        | computer_science  |    240 | MIT Press        |
|  15 | Age of Wrath, The                                      | Eraly, Abraham         | history           |    238 | Penguin          |
|  16 | Trial, The                                             | Kafka, Frank           | fiction           |    198 | Random House     |
|  17 | Statistical Decision Theory'                               | Pratt, John            | data_science      |    236 | MIT Press        |
|  18 | Data Mining Handbook                                  | Nisbet, Robert         | data_science      |    242 | Apress           |
|  19 | New Machiavelli, The                                   | Wells, H. G.           | fiction           |    180 | Penguin          |
|  20 | Physics & Philosophy                                   | Heisenberg, Werner     | science           |    197 | Penguin          |
|  21 | Making Software                                       | Oram, Andy             | computer_science  |    232 | O'Reilly         |
|  .  | .......                                                 | .......                | ....              |    ... | ....             |
|  .  | .......                                                 | .......                | ....              |    ... | ....             |

ChatSQL由兩個主要部分組成。首先,MySQL查詢是通過ChatGPT給定的純文本生成的。執行這些生成的查詢。在第二步中,對數據庫中返回的結果進行評估。在這個階段,結果可以直接呈現給用戶,也可以發回ChatGPT進行進一步的分析和解釋。因此,您可以使用ChatGPT您的數據庫進行互動。

假設用戶想要顯示篇幅大于175頁、少于178圖書類型小說。作者不應該是‘Doyle, Arthur Conan’。因此,可以在這種情況下使用以下命令。

python3 chatsql.py -p 'Show me the book type fiction which they height bigger than 175 and smaller than 178. The author shouldn't be 'Doyle, Arthur Conan'. '

結果,獲得了如下信息。

CHATGPT QUERY------------------:
SELECT * FROM bt WHERE Genre = 'Fiction' AND Height > 175 AND Height < 178 AND Author != 'Doyle, Arthur Conan'
RAW RESULT------------------:
[(32, 'Pillars of the Earth, The', 'Follett, Ken', 'fiction', 176, 'Random House'), (37, 'Veteran, The', 'Forsyth, Frederick', 'fiction', 177, 'Transworld'), (38, 'False Impressions', 'Archer, Jeffery', 'fiction', 177, 'Pan'), (72, 'Prisoner of Birth, A', 'Archer, Jeffery', 'fiction', 176, 'Pan'), (87, 'City of Joy, The', 'Lapierre, Dominique', 'fiction', 177, 'vikas'), (128, 'Rosy is My Relative', 'Durrell, Gerald', 'fiction', 176, 'nan')]
PROCESSED RESULT------------------ :
The books 'Pillars of the Earth, The' by Ken Follett, 'Veteran, The' by Frederick Forsyth, 'False Impressions' by Jeffery Archer, 'Prisoner of Birth, A' by Jeffery Archer, 'City of Joy, The' by Dominique Lapierre, and 'Rosy is My Relative' by Gerald Durrell are all fiction books with 176 or 177 pages published by Random House, Transworld, Pan, Vikas, and Nan, respectively.

如果數據庫列名稱正確,ChatGPT將理解這些名稱,并相應地響應查詢。然而些情況下,數據庫中的列名可能沒有意義,或者ChatGPT可能無法完全搞清楚其上下文。因此,為了確保系統正常運行,有必要向ChatGPT提供有關數據庫的先信息。info.json文件可以用來添加信息。

+-----+--------------------------------------------------------+------------------------+-------------------+------+------------------+ 
| ID | aa                                                     | bb 
| cc               | dd    | ee          |
+-----+--------------------------------------------------------+------------------------+-------------------+------+------------------+ 
| 1 | Fundamentals of Wavelets                                   | Goswami, Jaideva 
| signal_processing  | 228  | Wiley         | 
| 2 | Data Smart                                               | Foreman, John 
| data_science      | 235  | Wiley         | 
| 3 | God Created the Integers                                    | Hawking, Stephen 
| mathematics      | 197  | Penguin       | 
| 4 | Superfreakonomics                                         | Dubner, Stephen 
| economics       | 179   | HarperCollins  | 
| 5 | Orientalism                                               | Said, Edward 
| history          | 197   | Penguin      |
| . | .......                                                     | .......
| ....             | ...    | ....           | 
| .  | .......                                                    | ....... 
| ....             | ...    | ....            |

比如說,我們有一個命名糟糕的數據庫,如下所示。在這種情況下,有關數據庫的必要信息被輸入到info.json文件

{“bt”: “Table Name”, “aa”: “Title of the book”, “bb”: “Author of the book”, “cc”: “Type of book”, “dd”: “Height of the book”, “ee”: “Book Publisher”}

然后使用相同的命令

python3 chatsql.py -p 'Show me the book type fiction which they height bigger than 175 and smaller than 178. The author shouldn't be 'Doyle, Arthur Conan'. '

即使數據庫中的列名選擇不當,ChatGPT也會生成正確的查詢,因為我們提供了正確的信息

{'query': "SELECT aa, bb, cc, dd FROM bt WHERE cc = 'fiction' AND dd > 175 AND dd < 178 AND bb != 'Doyle, Arthur Conan'", 'raw_result': "[('Pillars of the Earth, The', 
'Follett, Ken', 'fiction', 176), ('Veteran, The', 'Forsyth, Frederick', 'fiction', 
177), ('False Impressions', 'Archer, Jeffery', 'fiction', 177), ('Prisoner of Birth, 
A', 'Archer, Jeffery', 'fiction', 176), ('City of Joy, The', 'Lapierre, Dominique', 
'fiction', 177), ('Rosy is My Relative', 'Durrell, Gerald', 'fiction', 176)]", 
'processed_result': '\nThe books "Pillars of the Earth, The" by Ken Follett, "Veteran,
The" by Frederick Forsyth, "False Impressions" by Jeffery Archer, "Prisoner of Birth, 
A" by Jeffery Archer, "City of Joy, The" by Dominique Lapierre and "Rosy is My
Relative" by Gerald Durrell are all fiction and have page lengths of 176 or 177.'}

下一個項目將是使用免費模型(Llama)由提示生成查詢(Mongo和SQL)。

  • 項目代碼倉庫:https://github.com/ademakdogan/ChatSQL
  • GitHub:https://github.com/ademakdogan
  • 領英:https://www.linkedin.com/in/adem-akdo?an-948334177/

原文標題:ChatSQL: Enabling ChatGPT to Generate SQL Queries from Plain Text,作者:Adem Akdogan


責任編輯:華軒 來源: 51CTO
相關推薦

2023-10-10 09:08:50

2018-05-14 10:50:13

SQL查詢語句神經網絡

2023-05-18 15:39:11

人工智能ChatGPT

2025-02-06 10:00:52

RedisSpring高性能

2021-03-31 22:39:04

區塊鏈司法數字化

2023-03-05 19:30:02

人工智能ChatGPT

2021-08-31 23:54:50

大數據人臉識別人工智能

2023-05-14 19:24:19

DPI技術路由器

2020-10-14 10:30:07

前端Node代碼

2019-04-08 16:48:37

5G數據中心無線連接

2024-04-28 09:12:16

CSS文本是否溢出前端

2019-11-01 10:00:14

前端業務代碼

2010-10-21 10:28:13

SQL Server查

2018-09-27 23:29:02

ICT

2023-05-08 08:03:10

2020-12-30 15:14:46

人工智能數據技術

2010-09-26 09:01:18

SQL強類型查詢
點贊
收藏

51CTO技術棧公眾號

亚洲36d大奶网| a'aaa级片在线观看| 色呦呦一区二区三区| 小草av在线播放| 午夜伦理精品一区| 亚洲一级二级| 国产在线视频你懂| 国产精品资源在线| 九九九九九精品| 狠狠色狠狠色综合日日五| 久久亚洲导航| 久久久最新网址| 成人在线视频首页| 成人视屏在线观看| 欧美最猛性xxxx| 久久日韩精品一区二区五区| 日韩影视在线| 国产精品扒开腿爽爽爽视频| 亚洲天堂精品在线观看| 国产电影一区二区| 国产又黄又大又粗视频| 久久精品国产亚洲| 免费成人av网站| 一区二区三区日韩欧美精品 | 欧美高清一级片在线| 成人福利一区| 爆操妹子视频在线观看| 国产精品网址在线| 国产精品三级av| 日韩精选视频| 日韩极品视频在线观看| 久久精品国产一区二区电影| 亚洲免费一区二区| 在线中文字幕视频| 久久久久久伊人| 亚洲最新在线观看| 一本久久综合| y111111国产精品久久久| 深夜福利视频在线免费观看| 国产九区一区在线| 欧美色视频日本版| 影视一区二区| 操你啦在线视频| 中文字幕色一区二区| 日韩精品一区第一页| 欧美xxxx黑人又粗又长精品| 欧美日韩精品在线播放| 国产69精品久久久久毛片 | aa成人免费视频| 日韩有码片在线观看| 亚洲国产视频网站| 99久久99久久精品免费看蜜桃| 成人精品毛片| a视频v在线| 91在线高清免费观看| 一区二区三区www| 欧美日本一区二区在线观看| 久久先锋影音av鲁色资源网| 国产综合自拍| 美女张开让男人捅| 68精品久久久久久欧美| 欧美日韩亚洲综合一区| 日本中文一区二区三区| 性欧美lx╳lx╳| 澳门av一区二区三区| www.成人.com| 中文有码在线观看| aaaaaaa大片免费看| 产国精品偷在线| 欧美最猛性xxxxx免费| 亚洲欧美日韩精品久久亚洲区| 一级毛片视频在线| 97超级碰在线看视频免费在线看| 亚洲第一激情av| 国产成人av影院| 伊人成人在线| 精品视频在线观看免费观看 | 免费国产黄色网址| 亚洲一区在线免费| 国产精品露脸av在线| 亚洲三级免费看| 亚洲国产第一页| 精品久久久久久久久久久院品网| 亚洲欧洲另类国产综合| 国产精品白丝在线| 天堂av在线一区| aⅴ色国产欧美| 9l视频自拍蝌蚪9l视频成人| 国产一区二区| 亚洲大奶少妇| 少妇久久久久| 亚洲v天堂v手机在线| 网友自拍一区| 日韩欧美视频一区二区三区四区| 欧美精品一区二区三区视频 | 欧美~级网站不卡| 精品久久久久久久久久久下田| 欧美香蕉视频| 国产调教精品| 国产精品毛片一区二区在线看| 成人综合一区| 国产农村妇女精品一二区| 久久精品观看| 99视频超级精品| 国产精品久久久久一区二区三区| 欧美日韩亚洲天堂| 欧美无乱码久久久免费午夜一区| 日韩精品在线播放| 国产国语videosex另类| 成人国产精品色哟哟| 永久久久久久| 91社在线播放| 在线观看国产视频一二三| 9l视频白拍9色9l视频| 国产一二三在线观看| 97se综合| 国产视频福利在线| www.com毛片| 亚洲成人一二三| 亚洲乱码国产乱码精品精| 久热精品在线视频| 激情小说综合区| 热这里只有精品| 国产网站免费观看| 久草在现在线| 成年美女黄网站色大片不卡| 欧美人妖在线| 99久久久久久| 91精品国产丝袜白色高跟鞋| 欧美另类在线播放| aaa免费在线观看| 自拍偷拍精选| 在这里有精品| 久久综合久久99| 国产丝袜一区二区| 国产成人中文字幕| 国产精品日韩在线观看| 国产wwwxx| mm1313亚洲国产精品美女| 99热精品久久| 午夜日韩在线电影| 在线观看免费高清视频97| 午夜精品一区二区在线观看的| 黄色av网址在线免费观看| 丁香五月缴情综合网| 国产99久久精品| 中文字幕自拍vr一区二区三区| 亚洲成人自拍| www在线观看黄色| 仙踪林久久久久久久999| 第一福利永久视频精品| 国产精品久久久久7777婷婷| 霍思燕三级露全乳照| 国产黄a三级三级三级av在线看 | 欧美xxxx中国| 国产精品亲子伦对白| 国产69精品久久久久99| 国产a级黄色大片| 国产亚洲高清在线观看| 国产成人无遮挡在线视频| 欧美tk—视频vk| 成人国产在线看| 9999久久久久| 国产69精品一区二区亚洲孕妇| 91精品免费在线观看| 欧美日韩不卡在线视频| 97se亚洲国产一区二区三区| 午夜天堂影视香蕉久久| 亚洲自拍小视频免费观看| 在线观看免费播放网址成人| 国产成人精品三级高清久久91| 色欧美日韩亚洲| 亚洲第一精品区| 99精品中文字幕在线不卡| 国产精品网站导航| 国产亚洲精品美女| 久久成人免费观看| 亚洲日产av中文字幕| 亚洲成av人片在www色猫咪| 91在线色戒在线| www.欧美日本韩国| 99久久久久免费精品国产| 国产精品天美传媒| 在线视频日本亚洲性| 国产乱淫av片杨贵妃| 电影一区二区| 国产suv精品一区二区6| 亚洲男女自偷自拍图片另类| 色婷婷久久综合| 欧美激情精品久久久| 一个人看的免费视频色| 成人婷婷网色偷偷亚洲男人的天堂| 欧美日韩色综合| 中文字幕国产免费| 一本久道综合久久精品| 国产视频精品xxxx| 日本加勒比高清在线| 日日摸夜夜添夜夜添亚洲女人| 国产成人精品免高潮费视频| 乱馆动漫1~6集在线观看|