[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
pub-company:icon2009 [2009/10/20 23:21]
stranak
pub-company:icon2009 [2009/10/21 14:35]
stranak
Line 34: Line 34:
 ==== Out of Vocabulary ==== ==== Out of Vocabulary ====
 No data have been lemmatised, so  all the numbers mean forms. No data have been lemmatised, so  all the numbers mean forms.
 +^           Vocabulary Size               ^^^
 ^ data                ^ tokens  ^ types ^ ^ data                ^ tokens  ^ types ^
 | **Tides-train-en**      | 1226144 | 48048 | | **Tides-train-en**      | 1226144 | 48048 |
Line 39: Line 40:
 | **Tides+DP11-train-en** | 1402536 | 52947 | | **Tides+DP11-train-en** | 1402536 | 52947 |
 | **Tides+DP11-train-hi** | 1434543 | 57131 | | **Tides+DP11-train-hi** | 1434543 | 57131 |
-| **Tides-dev-en**           | 22485 | 5596 | +| **Tides-dev-en**          22485 |  5596 | 
-| **Tides-dev-hi**           | 24363 | 5642 | +| **Tides-dev-hi**          24363 |  5642 | 
-| **Tides-test-en**          | 27169 | 5939 | +| **Tides-test-en**         27169 |  5939 | 
-| **Tides-test-hi**          | 28574 | 5872 |+| **Tides-test-hi**         28574 |  5872 |
  
  
 ^         Coverage               ^^^^^ ^         Coverage               ^^^^^
-               | **tokens seen in train**|| **types seen in train**  || +                  | **tokens seen in train**  ||||  **types seen in train**  |||| 
-               |  //Tides//  | //Tides+DP//  |  //Tides//  //Tides+DP// +                  |  //Tides//  ||  //Tides+DP//  ||  //Tides//  |//Tides+DP// || 
-| **Tides-test-en** |                                      +|                   | abs |  OOV  | abs |    OOV   | abs |  OOV  | abs |    OOV   
-| **Tides-test-hi** |                                      +| **Tides-test-en** |                                                       
-| **Tides-dev-en**                                      +| **Tides-test-hi** |                                                       
-| **Tides-dev-hi**                                      |+| **Tides-dev-en**                                                       
 +| **Tides-dev-hi**                                                       |
  

[ Back to the navigation ] [ Back to the content ]