国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

TTS和TTT已過(guò)時(shí)?TTRL橫空出世,推理模型擺脫「標(biāo)注數(shù)據(jù)」依賴,性能暴漲

人工智能 新聞
在最新的一篇論文中,清華大學(xué)和上海人工智能實(shí)驗(yàn)室提出了一種新方法 —— 測(cè)試時(shí)強(qiáng)化學(xué)習(xí)(Test-Time Reinforcement Learning,TTRL),該方法能夠在無(wú)標(biāo)注數(shù)據(jù)上對(duì) LLM 進(jìn)行強(qiáng)化學(xué)習(xí)訓(xùn)練。

在大語(yǔ)言模型(LLMs)競(jìng)爭(zhēng)日趨白熱化的今天,「推理能力」已成為評(píng)判模型優(yōu)劣的關(guān)鍵指標(biāo)。OpenAI 的 o 系列、Anthropic 的 Claude 和 DeepSeek-R1 等模型的驚艷表現(xiàn)背后,測(cè)試時(shí)縮放(TTS)技術(shù)功不可沒(méi)。

測(cè)試時(shí)縮放(TTS,Test-Time Scaling)是一種提升大語(yǔ)言模型推理能力的新興策略,通過(guò)在測(cè)試階段優(yōu)化推理過(guò)程(如多數(shù)投票、蒙特卡洛樹(shù)搜索等)提升大型語(yǔ)言模型(LLMs)的性能,而無(wú)需修改模型參數(shù)。

研究表明,TTS 在計(jì)算效率上優(yōu)于預(yù)訓(xùn)練階段擴(kuò)大模型規(guī)模,能以更低資源成本實(shí)現(xiàn)更好表現(xiàn)。然而,TTS 依賴預(yù)訓(xùn)練知識(shí),在面對(duì)未標(biāo)注新數(shù)據(jù)或輸入分布變化時(shí),泛化能力受限。如 OpenAI o3 在某基準(zhǔn)任務(wù)上達(dá)到 75.7% 的成功率,對(duì)更復(fù)雜的新任務(wù)卻僅能解決 4% 的問(wèn)題。

為克服 TTS 的局限,測(cè)試時(shí)訓(xùn)練(TTT,Test-Time Training)一度受到廣泛關(guān)注。TTT 通過(guò)在測(cè)試階段利用 RL 等技術(shù)動(dòng)態(tài)更新模型參數(shù),使模型適應(yīng)新數(shù)據(jù)或任務(wù),彌補(bǔ)了 TTS 在泛化能力上的不足。但 TTT 同樣面臨自身的挑戰(zhàn):測(cè)試階段缺乏獎(jiǎng)勵(lì)函數(shù)或驗(yàn)證信號(hào),而人工標(biāo)注數(shù)據(jù)的高成本使得無(wú)監(jiān)督環(huán)境下的 RL 應(yīng)用受限。

在最新的一篇論文中,清華大學(xué)和上海人工智能實(shí)驗(yàn)室提出了一種新方法 —— 測(cè)試時(shí)強(qiáng)化學(xué)習(xí)(Test-Time Reinforcement Learning,TTRL),該方法能夠在無(wú)標(biāo)注數(shù)據(jù)上對(duì) LLM 進(jìn)行強(qiáng)化學(xué)習(xí)訓(xùn)練。

image.png

  • 論文標(biāo)題:TTRL: Test-Time Reinforcement Learning
  • 論文地址:https://arxiv.org/abs/2504.16084
  • GitHub:https://github.com/PRIME-RL/TTRL
  • HuggingFace:https://huggingface.co/papers/2504.16084

TTRL 通過(guò)利用預(yù)訓(xùn)練模型中的先驗(yàn)知識(shí),使 LLM 具備自我演化的能力。實(shí)驗(yàn)證明,TTRL 在多種任務(wù)和模型上都能持續(xù)提升性能:在僅使用未標(biāo)注測(cè)試數(shù)據(jù)的情況下,TTRL 將 Qwen-2.5-Math-7B 在 AIME 2024 任務(wù)中的 pass@1 指標(biāo)提升了約 159%。

image.png

值得注意的是,雖然 TTRL 僅依靠 Maj@N 指標(biāo)進(jìn)行監(jiān)督,但其表現(xiàn)不僅能持續(xù)超越初始模型的性能上限,更能接近于那些直接在有標(biāo)注測(cè)試數(shù)據(jù)上進(jìn)行監(jiān)督訓(xùn)練的模型性能。實(shí)驗(yàn)結(jié)果驗(yàn)證了 TTRL 在多種任務(wù)中的廣泛有效性,充分展示了該方法在更廣闊領(lǐng)域中的應(yīng)用潛力。

方法

image.png

圖 2 展示了研究者提出的 TTRL 方法如何應(yīng)對(duì)此類挑戰(zhàn)。給定狀態(tài)表示為輸入提示 x(prompt x),模型依據(jù)參數(shù)化策略 π_θ(y | x) 生成輸出 y。為了在無(wú)真實(shí)標(biāo)簽的條件下構(gòu)造獎(jiǎng)勵(lì)信號(hào),研究者通過(guò)重復(fù)采樣的方法,從模型中生成多個(gè)候選輸出 {y?, y?, ..., y_N}。接著,使用多數(shù)投票(majority voting)或其他聚合方法從這些候選中推導(dǎo)出共識(shí)輸出 y*,作為近似的最優(yōu)動(dòng)作(optimal action)的替代。

環(huán)境反饋的獎(jiǎng)勵(lì) r (y, y*) 則根據(jù)當(dāng)前動(dòng)作 y 與共識(shí)輸出 y* 之間的一致性進(jìn)行設(shè)定。模型的 RL 目標(biāo)是最大化期望獎(jiǎng)勵(lì):

圖片

通過(guò)梯度上升(gradient ascent)更新參數(shù) θ:

圖片

該方法能夠在推理階段實(shí)現(xiàn)模型的動(dòng)態(tài)適應(yīng),無(wú)需標(biāo)注數(shù)據(jù)即可提升模型應(yīng)對(duì)分布變化輸入時(shí)的性能。

多數(shù)投票獎(jiǎng)勵(lì)函數(shù)(Majority Voting Reward Function)

多數(shù)投票獎(jiǎng)勵(lì)機(jī)制的核心在于:首先借助多數(shù)投票策略估算一個(gè)偽標(biāo)簽(pseudo-label),再基于該估計(jì)標(biāo)簽計(jì)算規(guī)則驅(qū)動(dòng)的獎(jiǎng)勵(lì)(rule-based rewards),并作為最終用于 RL 訓(xùn)練的獎(jiǎng)勵(lì)信號(hào)。

在具體操作上,給定一個(gè)輸入問(wèn)題 x,研究者對(duì)其輸入到大型語(yǔ)言模型中,并生成一組輸出結(jié)果。隨后,答案抽取器(answer extractor)對(duì)這些輸出進(jìn)行處理,提取對(duì)應(yīng)的預(yù)測(cè)答案,記為 P = {??}?_{i=1}。接著,研究者在集合 P 上應(yīng)用第 4 節(jié)定義的多數(shù)投票策略函數(shù) s (y, x),選出出現(xiàn)頻次最高的預(yù)測(cè) y,作為估計(jì)標(biāo)簽。

隨后,該多數(shù)投票結(jié)果 y 被用作標(biāo)簽估計(jì),用于計(jì)算基于規(guī)則的獎(jiǎng)勵(lì)信號(hào):

image.png

image.png

實(shí)驗(yàn)

TTRL 在大多數(shù)任務(wù)和模型上都表現(xiàn)出色。盡管 TTRL 完全依賴于使用無(wú)標(biāo)注測(cè)試數(shù)據(jù)的自我進(jìn)化,但其性能卻可媲美基于大規(guī)模標(biāo)注數(shù)據(jù)集訓(xùn)練的現(xiàn)有 RL 模型。如表 1 所示,在 AIME 2024 上,TTRL 實(shí)現(xiàn)了 159.3% 的大幅提升,超過(guò)了所有在大規(guī)模數(shù)據(jù)集上訓(xùn)練的模型。此外,當(dāng)應(yīng)用于 Qwen2.5-Math-7B 時(shí),TTRL 在三個(gè)基準(zhǔn)測(cè)試中平均提高了 84.1%。

截屏2025-04-24 09.15.54.png

TTRL 自然擴(kuò)展。另一個(gè)值得注意的現(xiàn)象是,隨著模型大小的增加(從 1.5B 到 7B),其在 AIME 2024 和 AMC 上的性能提升也在增加,這凸顯了 TTRL 的自然擴(kuò)展行為:更大的模型可以在自我改進(jìn)過(guò)程中產(chǎn)生更準(zhǔn)確的多數(shù)投票獎(jiǎng)勵(lì),從而更有效地學(xué)習(xí)新數(shù)據(jù)。不過(guò),LLaMA-3.1-8B-Instruct 和 Qwen2.5-Math-1.5B 可能由于容量有限,未能通過(guò) TTRL 在 AIME 2024 上取得有意義的進(jìn)展。相比之下,Qwen2.5-Math-7B 的模型容量更大,知識(shí)更充分,因此可以從自我改進(jìn)中獲益,從而取得明顯的性能提升(第 4.3 節(jié)會(huì)詳細(xì)討論這一點(diǎn))。

TTRL 在目標(biāo)任務(wù)之外也有很好的通用性。研究者以 Qwen2.5-Math-7B 為骨干,在每個(gè)基準(zhǔn)上執(zhí)行了 TTRL,并在其他基準(zhǔn)上進(jìn)行了進(jìn)一步評(píng)估。圖 3 展示了結(jié)果。盡管這種設(shè)置具有分布外的性質(zhì),但 TTRL 在所有基準(zhǔn)上都取得了實(shí)質(zhì)性的改進(jìn)。這表明 TTRL 并沒(méi)有依賴過(guò)擬合(過(guò)擬合會(huì)導(dǎo)致在其他任務(wù)上的取舍),而是在自我改進(jìn)過(guò)程中獲得了可推廣的收益。

截屏2025-04-24 09.17.07.png

TTRL 與不同的 RL 算法兼容。圖 4 展示了結(jié)果。研究者在 MATH-500 上使用 PPO 應(yīng)用 TTRL,以評(píng)估其與不同強(qiáng)化學(xué)習(xí)算法的兼容性。PPO 和 GRPO 的性能軌跡非常接近。與 GRPO 相比,PPO 能產(chǎn)生更穩(wěn)定的結(jié)果,同時(shí)實(shí)現(xiàn)相似的整體性能。

討論

Q1:TTRL 的性能能有多好?

研究者使用了兩個(gè)上限來(lái)分析 TTRL 的潛在性能。第一個(gè)上限是 Maj@N,用于計(jì)算 TTRL 訓(xùn)練過(guò)程中的獎(jiǎng)勵(lì)。第二個(gè)上限是在基準(zhǔn)數(shù)據(jù)集上的直接訓(xùn)練,它假定可以訪問(wèn) ground-truth 標(biāo)簽,因此會(huì)向策略模型泄露標(biāo)簽信息。

關(guān)鍵發(fā)現(xiàn)如下:

1. TTRL 不僅超越了其訓(xùn)練信號(hào)和初始模型的直觀上界 Maj@N,還接近了用標(biāo)注測(cè)試數(shù)據(jù)訓(xùn)練的直接 RL 的性能。這一進(jìn)步可能要?dú)w功于 TTRL 使用 RL 進(jìn)行測(cè)試時(shí)間訓(xùn)練:通過(guò)將基于投票的偽標(biāo)簽轉(zhuǎn)換為獎(jiǎng)勵(lì),它提高了有效監(jiān)督的質(zhì)量,同時(shí)使學(xué)習(xí)擺脫了 Maj@N 的限制。

2. TTRL 的經(jīng)驗(yàn)上限是在測(cè)試數(shù)據(jù)上進(jìn)行訓(xùn)練(即在測(cè)試數(shù)據(jù)上進(jìn)行訓(xùn)練),這凸顯了它與標(biāo)準(zhǔn)訓(xùn)練評(píng)估協(xié)議相比在功效上的潛在優(yōu)勢(shì)。

3. 對(duì)于具有挑戰(zhàn)性的任務(wù),TTRL 只需使用 1.5B 模型即可達(dá)到經(jīng)驗(yàn)上限。這表明,現(xiàn)在 LLM 可以通過(guò) TTRL 有效地自我進(jìn)化,從而在大規(guī)模數(shù)據(jù)集上實(shí)現(xiàn)無(wú)限制的終身學(xué)習(xí)。

TTRL 受 Maj@N 監(jiān)督,卻超越了 Maj@N。圖 6 展示了 TTRL 在 Qwen2.5-Math-7B 上的測(cè)試結(jié)果。可以看出,在所有基準(zhǔn)測(cè)試中,TTRL Avg@64 均優(yōu)于 Qwen2.5-Math-7B Maj@64,大大超出預(yù)期。此外,在應(yīng)用多數(shù)表決時(shí),TTRL 的性能也有大幅提升。

截屏2025-04-24 10.08.25.png

TTRL 的「性能增益法」基準(zhǔn)訓(xùn)練,圖 7 展示了結(jié)果。令人驚訝的是,TTRL 的性能曲線非常接近 RL(泄漏)的性能曲線。

截屏2025-04-24 10.05.10.png

Q2:TTRL 為何有效?

這一節(jié)主要分析了 TTRL 在無(wú)監(jiān)督條件下實(shí)現(xiàn)穩(wěn)定有效的 RL 的因素,包括兩個(gè)關(guān)鍵方面:標(biāo)簽估計(jì)和獎(jiǎng)勵(lì)計(jì)算。

標(biāo)簽估計(jì)。TTRL 與標(biāo)準(zhǔn) RL 算法的一個(gè)直接區(qū)別是,TTRL 涉及標(biāo)簽估計(jì),而標(biāo)簽估計(jì)會(huì)帶來(lái)獎(jiǎng)勵(lì)誤差。研究者認(rèn)為,盡管存在這些誤差,TTRL 仍能正常工作,原因有以下兩點(diǎn):

(i) 現(xiàn)有研究表明,RL 可以容忍一定程度的獎(jiǎng)勵(lì)不準(zhǔn)確性。此外,與通常依賴于記憶訓(xùn)練數(shù)據(jù)的監(jiān)督微調(diào)(SFT)相比,RL 的泛化效果往往更好。在 RL 中,獎(jiǎng)勵(lì)通常是模糊的,主要是作為探索的方向信號(hào),這導(dǎo)致了 RL 對(duì)獎(jiǎng)勵(lì)噪聲的魯棒性。

(ii) 之前的研究還從優(yōu)化的角度研究了什么是好的獎(jiǎng)勵(lì)模型,發(fā)現(xiàn)更準(zhǔn)確的獎(jiǎng)勵(lì)模型不一定是更好的教師。因此,由政策模型本身估計(jì)的獎(jiǎng)勵(lì)信號(hào)可能會(huì)為學(xué)習(xí)提供更合適的指導(dǎo)。

獎(jiǎng)勵(lì)計(jì)算。當(dāng)模型能夠通過(guò)多數(shù)投票估算出準(zhǔn)確的標(biāo)簽時(shí),隨后估算出的獎(jiǎng)勵(lì)一般都是可靠的。然而,一個(gè)自然而然的問(wèn)題出現(xiàn)了:為什么在 AIME 2024 等具有挑戰(zhàn)性的基準(zhǔn)上,即使模型無(wú)法估算出準(zhǔn)確的標(biāo)簽,TTRL 仍然有效?

研究者表示,最根本的原因在于 RL 中獎(jiǎng)勵(lì)的定義。基于規(guī)則的獎(jiǎng)勵(lì)是根據(jù)預(yù)測(cè)答案是否與「標(biāo)簽」匹配來(lái)分配的。因此,即使估計(jì)的標(biāo)簽不是 ground-truth,只要它與錯(cuò)誤預(yù)測(cè)的答案不同,系統(tǒng)仍可分配正確的「負(fù)」獎(jiǎng)勵(lì)。

為了提供更詳細(xì)的案例研究,研究者在 Qwen2.5-Math-7B 上檢驗(yàn)了 TTRL 在 AIME 2024 上的性能。圖 8 顯示了三個(gè)指標(biāo)的變化曲線。

截屏2025-04-24 10.18.20.png

研究者發(fā)現(xiàn)了 TTRL 在 AIME 2024 上依然有效的兩個(gè)主要原因:

  • 首先,獎(jiǎng)勵(lì)比標(biāo)簽更密集,即使估計(jì)的標(biāo)簽不準(zhǔn)確,也有更多機(jī)會(huì)恢復(fù)有用的學(xué)習(xí)信號(hào)。
  • 其次,當(dāng)模型能力較弱時(shí),TTRL 給出的獎(jiǎng)勵(lì)可能更準(zhǔn)確。

Q3:TTRL 何時(shí)失效?

在算法層面,TTRL 與現(xiàn)有的 RL 算法并無(wú)本質(zhì)區(qū)別,因此繼承了它們的一些特點(diǎn),如對(duì)數(shù)據(jù)難度的敏感性、對(duì)先驗(yàn)的強(qiáng)烈依賴性以及在某些條件下崩潰的風(fēng)險(xiǎn)。

在實(shí)現(xiàn)層面上,這些問(wèn)題因 TTRL 的限制而進(jìn)一步擴(kuò)大,TTRL 通過(guò)多數(shù)投票來(lái)估計(jì)標(biāo)簽,并且只在稀疏和以前未見(jiàn)過(guò)的測(cè)試數(shù)據(jù)上運(yùn)行,在某些情況下可能會(huì)導(dǎo)致失敗。

在初步實(shí)驗(yàn)中,研究者發(fā)現(xiàn)了兩個(gè)潛在問(wèn)題:

缺乏對(duì)目標(biāo)任務(wù)的先驗(yàn)知識(shí)。如表 2 所示,研究者發(fā)現(xiàn),隨著問(wèn)題難度的增加,性能提高率和長(zhǎng)度縮減率都呈下降趨勢(shì)。這表明主干系統(tǒng)的可用先驗(yàn)知識(shí)不足以支持對(duì)更具挑戰(zhàn)性問(wèn)題的學(xué)習(xí)。

截屏2025-04-24 11.00.39.png

不恰當(dāng)?shù)?RL 超參數(shù)。圖 10 比較了在 AIME 2024 上的幾次失敗嘗試。

截屏2025-04-24 11.03.29.png

更多研究細(xì)節(jié),可參考原論文。

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2010-03-25 10:04:10

UbuntuOne M

2021-12-17 07:00:56

ESMongoDBRedisJson

2018-11-29 10:49:36

2022-05-12 15:25:16

惡意軟件網(wǎng)絡(luò)攻擊

2013-11-01 09:07:15

2025-07-09 08:51:04

2010-12-09 09:09:37

2016-10-08 23:30:58

Power8云計(jì)算

2016-04-27 11:01:11

SparkStormApache Apex

2025-07-15 02:00:00

UIUCEBT架構(gòu)

2009-05-07 18:50:35

四核Nehalem服務(wù)器

2011-05-04 15:09:56

激光打印機(jī)奔圖科技

2023-02-21 21:48:29

2014-01-17 14:08:45

移動(dòng)os國(guó)產(chǎn)軟件

2023-04-19 07:34:21

AutoGPT程序員GitHub

2025-11-12 17:14:11

字節(jié)豆包 CodingClaude

2025-07-25 07:59:42

2015-06-19 09:21:52

JointForce解放號(hào)

2014-11-13 16:37:50

2020-10-28 11:54:05

AI 數(shù)據(jù)人工智能
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

2019亚洲男人天堂| 国产激情在线看| 成人涩涩网站| 亚洲二区中文字幕| 涩涩视频在线播放| 日韩欧美区一区二| 国产精品xx| 在线观看av一区二区| 国产精品av免费观看| 国产精品igao视频网网址不卡日韩 | 国产极品粉嫩福利姬萌白酱| 日韩大陆av| 韩国一区二区在线观看| 欧美日韩国产成人| 精品乱码一区二区三四区视频| 亚洲精品孕妇| 欧美精品video| 毛片毛片毛片毛片毛片毛片毛片毛片毛片 | 岛国视频午夜一区免费在线观看| 色偷偷噜噜噜亚洲男人| 日本国产在线播放| 日韩精品第一| 亚洲成人三级在线| 一区二区成人网| 欧美日韩mv| 日韩精品中文字幕一区二区三区 | 国产精品无码专区在线观看| 欧洲天堂在线观看| 26uuu亚洲| 91文字幕巨乱亚洲香蕉| 天使と恶魔の榨精在线播放| 亚洲国产高清在线| 一本一本久久a久久精品牛牛影视 一本色道久久综合亚洲精品小说 一本色道久久综合狠狠躁篇怎么玩 | 男人午夜天堂| 欧美精品尤物在线观看| 伊人久久五月天| 国语对白在线刺激| 欧美日韩成人高清| 国产在线视频资源| 疯狂做受xxxx欧美肥白少妇| 2020中文字幕在线| 26uuu国产一区二区三区| 亚洲永久激情精品| 性欧美长视频| 久久国产精品-国产精品| 国内精品久久久久久久97牛牛| 欧美大片免费观看| 91亚洲精品在看在线观看高清| 亚洲精品白浆高清久久久久久| 成人区精品一区二区不卡| 欧美精品日韩精品| 一色桃子av在线| 欧美日韩国产影片| 国产中文字幕在线视频| 亚洲制服丝袜av| 六十路在线观看| 中文字幕制服丝袜成人av| 五月天亚洲视频| 亚洲三级电影全部在线观看高清| 国内自拍视频网| 1区2区3区精品视频| 蜜桃传媒在线| 国产一区二区三区在线观看免费视频 | 国产色在线 com| 精品国产91久久久久久老师| 男人天堂综合| 日本大香伊一区二区三区| 玖玖在线免费视频| 欧美天天综合色影久久精品| 国产精品视频一区二区久久| 色偷偷久久一区二区三区| 在线不卡视频一区二区| 久久91麻豆精品一区| 日韩一区二区在线播放| 在线成人动漫| 成人免费在线视频| 99re国产| 亚洲三区在线观看| 成年人视频在线看| 91浏览器在线视频| 国产片侵犯亲女视频播放| 亚洲一区亚洲| 91天堂在线视频| 久久伊人亚洲| 欧美女人性生活视频| 成人午夜短视频| 97视频在线免费| 一区二区三区成人| 亚洲婷婷噜噜| 欧美老女人在线视频| 婷婷亚洲五月| 欧美亚洲精品日韩| 欧美日韩亚洲在线观看| 色国产精品一区在线观看| 日漫免费在线观看网站| 欧美一区二区美女| 韩国一区二区三区视频| 欧美激情一级精品国产| 天天躁日日躁狠狠躁欧美| 日本久久久久久久久| 久久激情视频| 国产免费视频| 欧美性极品xxxx做受| heyzo高清国产精品| 国内成人精品一区| 久久精品人人做人人爽电影蜜月| 在线观看av日韩| 欧美午夜精品久久久久久人妖| 国产福利第一视频在线播放| 在线观看日韩视频| 亚洲一区在线| 成人一区二区免费视频| 一区二区三区在线免费观看| 国产小视频免费在线观看| 久久国产精品久久精品| 天堂va蜜桃一区二区三区| 在线免费观看av的网站| 国产九色精品成人porny| 激情综合在线观看| 一区二区三区免费在线观看| gogo在线高清视频| 国产精品久久久久久久久免费看| 国产精品中文字幕一区二区三区| 一区二区三区韩国| 欧美成人猛片aaaaaaa| 成人国产精选| 欧美精品成人一区二区在线观看| 亚洲国产精品成人综合色在线婷婷| 国产黄视频在线观看| 精品国产伦一区二区三区观看体验| 久久高清免费| 手机福利视频欧美| 欧美成人免费网| 国产亚洲精品aa| 久久99亚洲网美利坚合众国| 欧美精品与人动性物交免费看| 日韩激情av在线播放| 日本一区二区三区四区 | jizz蜜桃视频在线观看| 欧美高清在线播放| 久久精品亚洲一区二区三区浴池| 久久久久久久久久久久电影| 欧美视频在线播放一区| 俺去啦;欧美日韩| 成人激情校园春色| 91精品国产一区二区在线观看| av观看免费在线| 91国产精品电影| 亚洲在线观看免费视频| 99久久激情| 成人性爱视频在线观看| 97欧洲一区二区精品免费| 欧美性猛片aaaaaaa做受| 日韩一级大片| 超碰资源在线| 韩国日本在线视频| 日本伊人精品一区二区三区介绍| 亚洲va韩国va欧美va| 91不卡在线观看| 毛片av在线| 狠狠精品干练久久久无码中文字幕 | 老司机午夜精品99久久| 2020国产在线| 国产福利片一区二区| 精品国产乱码91久久久久久网站| 99国产精品久久久久久久 | 国产香蕉精品| 国产专区一区二区| 精品日韩一区二区| 2023国产精品| 欧美呦呦网站| free性欧美hd另类精品| 欧美日韩成人免费视频| 91成人免费观看网站| 成人av网站在线观看免费| 国语对白在线刺激| 国产福利精品av综合导导航| 国产在线视视频有精品| av电影高清在线观看| 高清视频欧美一级| 不卡的电视剧免费网站有什么| 国产一区久久精品| 亚洲一区亚洲二区| 亚洲成a人片综合在线| 欧美一级色片| 九九热精品在线播放| 久久亚洲精品成人| a级精品国产片在线观看| 成人免费网站视频| 国产精品三级一区二区| 亚洲夜晚福利在线观看| 国产毛片精品视频| 色多多在线观看| 亚洲永久一区二区三区在线| 日韩一区二区视频在线观看| 日韩黄色在线观看| 亚洲国产天堂| 国产1区2区3区| 久久久精品在线| 亚洲女同中文字幕|