ログイン
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 生活環境学部
  2. 学外刊行物(生活環境学部)
  3. 雑誌

Evaluating the IWSLT2023 Speech Translation Tasks: Human Annotations, Automatic Metrics, and Segmentation

http://hdl.handle.net/10935/0002006124
http://hdl.handle.net/10935/0002006124
b8365f31-61b2-4e99-8bac-0f4b00cf81f6
名前 / ファイル ライセンス アクション
/ https://arxiv.org/pdf/2406.03881
Item type default_学術雑誌論文 / Journal Article(1)
タイトル
タイトル Evaluating the IWSLT2023 Speech Translation Tasks: Human Annotations, Automatic Metrics, and Segmentation
言語 en
言語
言語 eng
キーワード
言語 en
主題Scheme Other
主題 Human evaluation
キーワード
言語 en
主題Scheme Other
主題 speech translation
キーワード
言語 en
主題Scheme Other
主題 evaluation metrics
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_6501
資源タイプ journal article
アクセス権
アクセス権 metadata only access
アクセス権URI http://purl.org/coar/access_right/c_14cb
著者 Matthias Sperber

× Matthias Sperber

en Matthias Sperber

Search repository
Ondřej Bojar

× Ondřej Bojar

en Ondřej Bojar

Search repository
Barry Haddow

× Barry Haddow

en Barry Haddow

Search repository
Dávid Javorský

× Dávid Javorský

en Dávid Javorský

Search repository
Xutai Ma

× Xutai Ma

en Xutai Ma

Search repository
Matteo Negri

× Matteo Negri

en Matteo Negri

Search repository
Jan Niehues

× Jan Niehues

en Jan Niehues

Search repository
Peter Polák

× Peter Polák

ja Peter Polák

Search repository
Elizabeth Salesky

× Elizabeth Salesky

en Elizabeth Salesky

Search repository
須藤 克仁

× 須藤 克仁

KAKEN2 1000000396152

Sudoh Katsuhito

ja 須藤 克仁

ja-Kana すどう かつひと

Search repository
抄録
内容記述タイプ Abstract
内容記述 Human evaluation is a critical component in machine translation system development and has received much attention in text translation research. However, little prior work exists on the topic of human evaluation for speech translation, which adds additional challenges such as noisy data and segmentation mismatches. We take first steps to fill this gap by conducting a comprehensive human evaluation of the results of several shared tasks from the last International Workshop on Spoken Language Translation (IWSLT 2023). We propose an effective evaluation strategy based on automatic resegmentation and direct assessment with segment context. Our analysis revealed that: 1) the proposed evaluation strategy is robust and scores well-correlated with other types of human judgements; 2) automatic metrics are usually, but not always, well-correlated with direct assessment scores; and 3) COMET as a slightly stronger automatic metric than chrF, despite the segmentation noise introduced by the resegmentation step systems. We release the collected human-annotated data in order to encourage further investigation.
言語 en
書誌情報 en : Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024)

p. 6484-6485, 発行日 2024-05
出版者
出版者 ELRA and ICCL
言語 en
DOI
識別子タイプ DOI
関連識別子 10.48550/arXiv.2406.03881
戻る
0
views
See details
Views

Versions

Ver.1 2025-02-21 02:17:31.994644
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR 2.0
  • OAI-PMH JPCOAR 1.0
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3