PIT

Name: PIT
License: Unknown

Paraphrase and Semantic Similarity in Twitter

Dataset Information

Modalities

Texts

Languages

English

License

Unknown

Homepage

Official Website

Contents

Overview

Paraphrase and Semantic Similarity in Twitter (PIT) presents a constructed Twitter Paraphrase Corpus that contains 18,762 sentence pairs.

Variants: PIT

This dataset is used in 1 benchmark:

Task	Model	Paper	Date
Paraphrase Identification	TSDAE	TSDAE: Using Transformer-based Sequential Denoising …	2021-04-14

Recent papers with results on this dataset:

External Links: