|
|
|
@ -45,72 +45,218 @@ public enum CalculateFor {
|
|
|
|
|
return null;
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
public String toMetadataString() {
|
|
|
|
|
public String totalSumString(int ngram) {
|
|
|
|
|
if (ngram == 0) {
|
|
|
|
|
switch (this) {
|
|
|
|
|
case WORD:
|
|
|
|
|
return "Skupna vsota vseh črkovnih nizov različnic:";
|
|
|
|
|
case NORMALIZED_WORD:
|
|
|
|
|
return "Skupna vsota vseh črkovnih nizov normaliziranih različnic:";
|
|
|
|
|
case LEMMA:
|
|
|
|
|
return "Skupna vsota vseh črkovnih nizov lem:";
|
|
|
|
|
case MORPHOSYNTACTIC_SPECS:
|
|
|
|
|
return "Skupna vsota vseh črkovnih nizov oblikoskladenjskih oznak:";
|
|
|
|
|
case MORPHOSYNTACTIC_PROPERTY:
|
|
|
|
|
return "Skupna vsota vseh črkovnih nizov oblikoskladenjskih lastnosti:";
|
|
|
|
|
case WORD_TYPE:
|
|
|
|
|
return "Skupna vsota vseh črkovnih nizov besednih vrst:";
|
|
|
|
|
case DIST_WORDS:
|
|
|
|
|
return "Skupna vsota vseh črkovnih nizov različnic:";
|
|
|
|
|
case DIST_LEMMAS:
|
|
|
|
|
return "Skupna vsota vseh črkovnih nizov lem:";
|
|
|
|
|
default:
|
|
|
|
|
return null;
|
|
|
|
|
}
|
|
|
|
|
} else if (ngram >= 1) {
|
|
|
|
|
switch (this) {
|
|
|
|
|
case WORD:
|
|
|
|
|
return "Skupna vsota vseh različnic:";
|
|
|
|
|
case NORMALIZED_WORD:
|
|
|
|
|
return "Skupna vsota vseh normaliziranih različnic:";
|
|
|
|
|
case LEMMA:
|
|
|
|
|
return "Skupna vsota vseh lem:";
|
|
|
|
|
case MORPHOSYNTACTIC_SPECS:
|
|
|
|
|
return "Skupna vsota vseh oblikoskladenjskih oznak:";
|
|
|
|
|
case MORPHOSYNTACTIC_PROPERTY:
|
|
|
|
|
return "Skupna vsota vseh oblikoskladenjskih lastnosti:";
|
|
|
|
|
case WORD_TYPE:
|
|
|
|
|
return "Skupna vsota vseh besednih vrst:";
|
|
|
|
|
case DIST_WORDS:
|
|
|
|
|
return "Skupna vsota vseh različnic:";
|
|
|
|
|
case DIST_LEMMAS:
|
|
|
|
|
return "Skupna vsota vseh lem:";
|
|
|
|
|
default:
|
|
|
|
|
return null;
|
|
|
|
|
}
|
|
|
|
|
}
|
|
|
|
|
return null;
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
public String foundSumString(int ngram) {
|
|
|
|
|
if (ngram == 0) {
|
|
|
|
|
switch (this) {
|
|
|
|
|
case WORD:
|
|
|
|
|
return "Skupna vsota vseh najdenih črkovnih nizov različnic:";
|
|
|
|
|
case NORMALIZED_WORD:
|
|
|
|
|
return "Skupna vsota vseh najdenih črkovnih nizov normaliziranih različnic:";
|
|
|
|
|
case LEMMA:
|
|
|
|
|
return "Skupna vsota vseh najdenih črkovnih nizov lem:";
|
|
|
|
|
case MORPHOSYNTACTIC_SPECS:
|
|
|
|
|
return "Skupna vsota vseh najdenih črkovnih nizov oblikoskladenjskih oznak:";
|
|
|
|
|
case MORPHOSYNTACTIC_PROPERTY:
|
|
|
|
|
return "Skupna vsota vseh najdenih črkovnih nizov oblikoskladenjskih lastnosti:";
|
|
|
|
|
case WORD_TYPE:
|
|
|
|
|
return "Skupna vsota vseh najdenih črkovnih nizov besednih vrst:";
|
|
|
|
|
case DIST_WORDS:
|
|
|
|
|
return "Skupna vsota vseh najdenih črkovnih nizov različnic:";
|
|
|
|
|
case DIST_LEMMAS:
|
|
|
|
|
return "Skupna vsota vseh najdenih črkovnih nizov lem:";
|
|
|
|
|
default:
|
|
|
|
|
return null;
|
|
|
|
|
}
|
|
|
|
|
} else if (ngram >= 1) {
|
|
|
|
|
switch (this) {
|
|
|
|
|
case WORD:
|
|
|
|
|
return "Skupna vsota vseh najdenih različnic:";
|
|
|
|
|
case NORMALIZED_WORD:
|
|
|
|
|
return "Skupna vsota vseh najdenih normaliziranih različnic:";
|
|
|
|
|
case LEMMA:
|
|
|
|
|
return "Skupna vsota vseh najdenih lem:";
|
|
|
|
|
case MORPHOSYNTACTIC_SPECS:
|
|
|
|
|
return "Skupna vsota vseh najdenih oblikoskladenjskih oznak:";
|
|
|
|
|
case MORPHOSYNTACTIC_PROPERTY:
|
|
|
|
|
return "Skupna vsota vseh najdenih oblikoskladenjskih lastnosti:";
|
|
|
|
|
case WORD_TYPE:
|
|
|
|
|
return "Skupna vsota vseh najdenih besednih vrst:";
|
|
|
|
|
case DIST_WORDS:
|
|
|
|
|
return "Skupna vsota vseh najdenih različnic:";
|
|
|
|
|
case DIST_LEMMAS:
|
|
|
|
|
return "Skupna vsota vseh najdenih lem:";
|
|
|
|
|
default:
|
|
|
|
|
return null;
|
|
|
|
|
}
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
return null;
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
public String totalAbsoluteFrequencyString(int ngram) {
|
|
|
|
|
if (ngram == 0) {
|
|
|
|
|
return "Skupna absolutna pogostost črkovnega niza";
|
|
|
|
|
}
|
|
|
|
|
switch(this){
|
|
|
|
|
case WORD:
|
|
|
|
|
return "Skupna vsota vseh različnic:";
|
|
|
|
|
return "Skupna absolutna pogostost različnice";
|
|
|
|
|
case NORMALIZED_WORD:
|
|
|
|
|
return "Skupna vsota vseh normaliziranih različnic:";
|
|
|
|
|
return "Skupna absolutna pogostost normalizirane različnice";
|
|
|
|
|
case LEMMA:
|
|
|
|
|
return "Skupna vsota vseh lem:";
|
|
|
|
|
return "Skupna absolutna pogostost leme";
|
|
|
|
|
case MORPHOSYNTACTIC_SPECS:
|
|
|
|
|
return "Skupna vsota vseh oblikoskladenjskih oznak:";
|
|
|
|
|
return "Skupna absolutna pogostost oblikoskladenjske oznake";
|
|
|
|
|
case MORPHOSYNTACTIC_PROPERTY:
|
|
|
|
|
return "Skupna vsota vseh oblikoskladenjskih lastnosti:";
|
|
|
|
|
return "Skupna absolutna pogostost oblikoskladenjske lastnosti";
|
|
|
|
|
case WORD_TYPE:
|
|
|
|
|
return "Skupna vsota vseh besednih vrst:";
|
|
|
|
|
return "Skupna absolutna pogostost besedne vrste";
|
|
|
|
|
case DIST_WORDS:
|
|
|
|
|
return "Skupna vsota vseh različnic:";
|
|
|
|
|
return "Skupna absolutna pogostost različnice";
|
|
|
|
|
case DIST_LEMMAS:
|
|
|
|
|
return "Skupna vsota vseh lem:";
|
|
|
|
|
return "Skupna absolutna pogostost leme";
|
|
|
|
|
default:
|
|
|
|
|
return null;
|
|
|
|
|
}
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
public String toHeaderString() {
|
|
|
|
|
public String shareOfTotalString(int ngram) {
|
|
|
|
|
if (ngram == 0) {
|
|
|
|
|
return "Delež glede na skupno vsoto vseh najdenih črkovnih nizov";
|
|
|
|
|
}
|
|
|
|
|
switch(this){
|
|
|
|
|
case WORD:
|
|
|
|
|
return "Različnica";
|
|
|
|
|
return "Delež glede na vse najdene različnice";
|
|
|
|
|
case NORMALIZED_WORD:
|
|
|
|
|
return "Normalizirana različnica";
|
|
|
|
|
return "Delež glede na vse najdene normalizirane različnice";
|
|
|
|
|
case LEMMA:
|
|
|
|
|
return "Lema";
|
|
|
|
|
return "Delež glede na vse najdene leme";
|
|
|
|
|
case MORPHOSYNTACTIC_SPECS:
|
|
|
|
|
return "Oblikoskladenjska oznaka";
|
|
|
|
|
return "Delež glede na vse najdene oblikoskladenjske oznake";
|
|
|
|
|
case MORPHOSYNTACTIC_PROPERTY:
|
|
|
|
|
return "Oblikoskladenjska lastnost";
|
|
|
|
|
return "Delež glede na vse najdene oblikoskladenjske lastnosti";
|
|
|
|
|
case WORD_TYPE:
|
|
|
|
|
return "Besedna vrsta";
|
|
|
|
|
return "Delež glede na vse najdene besedne vrste";
|
|
|
|
|
case DIST_WORDS:
|
|
|
|
|
return "Različnica";
|
|
|
|
|
return "Delež glede na vse najdene različnice";
|
|
|
|
|
case DIST_LEMMAS:
|
|
|
|
|
return "Lema";
|
|
|
|
|
return "Delež glede na vse najdene leme";
|
|
|
|
|
default:
|
|
|
|
|
return null;
|
|
|
|
|
}
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
public String toHeaderString(int ngram) {
|
|
|
|
|
if (ngram == 0) {
|
|
|
|
|
return "Črkovni niz";
|
|
|
|
|
} else if (ngram == 1) {
|
|
|
|
|
switch (this) {
|
|
|
|
|
case WORD:
|
|
|
|
|
return "Različnica";
|
|
|
|
|
case NORMALIZED_WORD:
|
|
|
|
|
return "Normalizirana različnica";
|
|
|
|
|
case LEMMA:
|
|
|
|
|
return "Lema";
|
|
|
|
|
case MORPHOSYNTACTIC_SPECS:
|
|
|
|
|
return "Oblikoskladenjska oznaka";
|
|
|
|
|
case MORPHOSYNTACTIC_PROPERTY:
|
|
|
|
|
return "Oblikoskladenjska lastnost";
|
|
|
|
|
case WORD_TYPE:
|
|
|
|
|
return "Besedna vrsta";
|
|
|
|
|
case DIST_WORDS:
|
|
|
|
|
return "Različnica";
|
|
|
|
|
case DIST_LEMMAS:
|
|
|
|
|
return "Lema";
|
|
|
|
|
default:
|
|
|
|
|
return null;
|
|
|
|
|
}
|
|
|
|
|
}
|
|
|
|
|
switch (this) {
|
|
|
|
|
case WORD:
|
|
|
|
|
case DIST_WORDS:
|
|
|
|
|
return "Različnica niza";
|
|
|
|
|
case NORMALIZED_WORD:
|
|
|
|
|
return "Normalizirana različnica niza";
|
|
|
|
|
case LEMMA:
|
|
|
|
|
case DIST_LEMMAS:
|
|
|
|
|
return "Lema niza";
|
|
|
|
|
case MORPHOSYNTACTIC_SPECS:
|
|
|
|
|
return "Oblikoskladenjska oznaka niza";
|
|
|
|
|
case MORPHOSYNTACTIC_PROPERTY:
|
|
|
|
|
return "Oblikoskladenjska lastnost niza";
|
|
|
|
|
case WORD_TYPE:
|
|
|
|
|
return "Besedna vrsta niza";
|
|
|
|
|
default:
|
|
|
|
|
return null;
|
|
|
|
|
}
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
public String toPercentString() {
|
|
|
|
|
switch(this){
|
|
|
|
|
case WORD:
|
|
|
|
|
return "Delež glede na vse različnice";
|
|
|
|
|
case NORMALIZED_WORD:
|
|
|
|
|
return "Delež glede na vse normalizirane različnice";
|
|
|
|
|
case LEMMA:
|
|
|
|
|
return "Delež glede na vse leme";
|
|
|
|
|
case MORPHOSYNTACTIC_SPECS:
|
|
|
|
|
return "Delež glede na vse oblikoskladenjske oznake";
|
|
|
|
|
case MORPHOSYNTACTIC_PROPERTY:
|
|
|
|
|
return "Delež glede na vse oblikoskladenjske lastnosti";
|
|
|
|
|
case WORD_TYPE:
|
|
|
|
|
return "Delež glede na vse besedne vrste";
|
|
|
|
|
case DIST_WORDS:
|
|
|
|
|
return "Delež glede na vse različnice";
|
|
|
|
|
case DIST_LEMMAS:
|
|
|
|
|
return "Delež glede na vse leme";
|
|
|
|
|
default:
|
|
|
|
|
return null;
|
|
|
|
|
}
|
|
|
|
|
}
|
|
|
|
|
// public String toPercentString() {
|
|
|
|
|
// switch(this){
|
|
|
|
|
// case WORD:
|
|
|
|
|
// return "Delež glede na vse različnice";
|
|
|
|
|
// case NORMALIZED_WORD:
|
|
|
|
|
// return "Delež glede na vse normalizirane različnice";
|
|
|
|
|
// case LEMMA:
|
|
|
|
|
// return "Delež glede na vse leme";
|
|
|
|
|
// case MORPHOSYNTACTIC_SPECS:
|
|
|
|
|
// return "Delež glede na vse oblikoskladenjske oznake";
|
|
|
|
|
// case MORPHOSYNTACTIC_PROPERTY:
|
|
|
|
|
// return "Delež glede na vse oblikoskladenjske lastnosti";
|
|
|
|
|
// case WORD_TYPE:
|
|
|
|
|
// return "Delež glede na vse besedne vrste";
|
|
|
|
|
// case DIST_WORDS:
|
|
|
|
|
// return "Delež glede na vse različnice";
|
|
|
|
|
// case DIST_LEMMAS:
|
|
|
|
|
// return "Delež glede na vse leme";
|
|
|
|
|
// default:
|
|
|
|
|
// return null;
|
|
|
|
|
// }
|
|
|
|
|
// }
|
|
|
|
|
}
|
|
|
|
|