Search in sources :

Example 6 with StringAttribute

use of com.joliciel.talismane.tokeniser.StringAttribute in project talismane by joliciel-informatique.

the class RegexMarkerFilterTest method testTag.

@Test
public void testTag() throws Exception {
    RawTextRegexAnnotator filter = new RawTextRegexAnnotator(RawTextMarkType.TAG, "<skip>(.*?)</skip>", 0, 1000);
    filter.setAttribute(new StringAttribute("TAG1", "x"));
    AnnotatedText text = new AnnotatedText("J'ai du <skip>skip me</skip>mal à le croire.<skip>skip this</skip>");
    filter.annotate(text);
    LOG.debug(text.getAnnotations().toString());
    List<Annotation<StringAttribute>> attributes = text.getAnnotations(StringAttribute.class);
    assertEquals(2, attributes.size());
    int i = 0;
    for (Annotation<StringAttribute> attribute : attributes) {
        if (i == 0) {
            assertEquals("J'ai du ".length(), attribute.getStart());
            assertEquals("J'ai du <skip>skip me</skip>".length(), attribute.getEnd());
            assertEquals("TAG1", attribute.getData().getKey());
            assertEquals("x", attribute.getData().getValue());
        } else if (i == 1) {
            assertEquals("J'ai du <skip>skip me</skip>mal à le croire.".length(), attribute.getStart());
            assertEquals("J'ai du <skip>skip me</skip>mal à le croire.<skip>skip this</skip>".length(), attribute.getEnd());
            assertEquals("TAG1", attribute.getData().getKey());
            assertEquals("x", attribute.getData().getValue());
        }
        i++;
    }
}
Also used : AnnotatedText(com.joliciel.talismane.AnnotatedText) StringAttribute(com.joliciel.talismane.tokeniser.StringAttribute) Annotation(com.joliciel.talismane.Annotation) TalismaneTest(com.joliciel.talismane.TalismaneTest) Test(org.junit.Test)

Aggregations

StringAttribute (com.joliciel.talismane.tokeniser.StringAttribute)6 Annotation (com.joliciel.talismane.Annotation)3 TalismaneTest (com.joliciel.talismane.TalismaneTest)3 Config (com.typesafe.config.Config)3 Test (org.junit.Test)3 TalismaneException (com.joliciel.talismane.TalismaneException)2 Sentence (com.joliciel.talismane.rawText.Sentence)2 TokenAttribute (com.joliciel.talismane.tokeniser.TokenAttribute)2 ArrayListNoNulls (com.joliciel.talismane.utils.ArrayListNoNulls)2 AnnotatedText (com.joliciel.talismane.AnnotatedText)1 TalismaneSession (com.joliciel.talismane.TalismaneSession)1 ClassificationModel (com.joliciel.talismane.machineLearning.ClassificationModel)1 ClassificationObserver (com.joliciel.talismane.machineLearning.ClassificationObserver)1 Decision (com.joliciel.talismane.machineLearning.Decision)1 DecisionMaker (com.joliciel.talismane.machineLearning.DecisionMaker)1 ExternalResource (com.joliciel.talismane.machineLearning.ExternalResource)1 MachineLearningModelFactory (com.joliciel.talismane.machineLearning.MachineLearningModelFactory)1 FeatureResult (com.joliciel.talismane.machineLearning.features.FeatureResult)1 RuntimeEnvironment (com.joliciel.talismane.machineLearning.features.RuntimeEnvironment)1 PosTaggerFeature (com.joliciel.talismane.posTagger.features.PosTaggerFeature)1