Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

BÍN #47

Open
sveinbjornt opened this issue Sep 7, 2023 · 1 comment
Open

BÍN #47

sveinbjornt opened this issue Sep 7, 2023 · 1 comment
Labels
discussion Discussion about project

Comments

@sveinbjornt
Copy link

sveinbjornt commented Sep 7, 2023

Þú veist að BÍN er aðgengilegt undir CC BY-SA 4.0?

Og öflugur Python pakki utan um gagnagrunninn hér: https://github.com/mideind/BinPackage

@Loknar
Copy link
Owner

Loknar commented Sep 8, 2023

BÍN er aðgengilegt undir CC BY-SA 4.0

já, góður vinur minn benti mér á það í fyrra, CC BY-SA 4.0 er skilst mér compatible við GPLv3, og ætli það sé þá ekki líka compatible við LGPLv3? hef samt í raun ekki pælt mikið í því ... ég gæti skoðað að importa orðum úr bín í grunninn? þyrfti væntanlega að bæta við tilgreiningu á því og vísun í uppruna bín gagnanna líkt og gert er hér ? og kannski vísa líka í commit id þar sem bín grunninum væri skeytt við? ýmsar spurningar þó sem þyrfti að skoða varðandi að fara í einhverja svoleiðis vegferð ..

en þú ert ef til viłl að benda á þetta með það að ljósi að það að halda í svona vegferð við smíði nýs orðagrunns frá grunni sé meiriháttar vitleysa og/eða allt of stórt og óviðráðanlegt dæmi? 😅 mátt endilega ljá mér skoðanir þínar nánar um það sértu með slíkar og til í að deila þeim

það er ekki beint hlaupið að því að fá að gera breytingar eða viðbætur á orðagrunnum Árnastofnunar, það er alveg eitthvað sem mætti bæta

þetta loka-ord verkefni mitt er vissulega bara lítið hobbíverkefni, og forritunin bara svona lala, ekkert til að hrópa húrra fyrir, en grunnurinn er með sql gagnasnið, að vísu útfært með ORM pakkanum SQLAlchemy, en engu að síður, svo eru stöku nýjungar sem mér datt í hug þegar ég var að reyna að niðurnjörva gagnasniðið, kennistrengir fyrir orð (fyrirgefðu mér Snorri), innleiðing á pólska Ł, "samsett" skilgreiningar fyrir samsett orð, beygingar samsettra orða í raun ekki geymd í SQL grunni en leidd út útfrá samsett lýsingu og prentuð í JSON skrár, hash strengir til að eyrnamerkja orðabreytingar, sér sérnafnaflokkar, örnefnaorðflokkur, listun skammstafana og ýmislegt annað

meginverðmætið í þessi verkefni mínu sem mér finnst ég sjá er þó það að auðvelt er fyrir hvern sem hefur áhuga á því, að afrita grunninn/verkefnið, gera breytingar á gagnastrúktúr, eða orðum sem viðkomandi er ekki sammála með beygingar á eða bæta við orðum sem viðkomandi þykir vanta, smíða síðan grunninn og nota í það sem viðkomandi hugnast, fork it, make your own custom version, publish under LGPL, something something everyone profits

Og öflugur Python pakki utan um gagnagrunninn hér

já, þessi islenska python modúłl hjá miðeind er mjög kúl, hef því miður fiktað voða lítið með hann enn sem komið er, mjög áhugaverð þessi "word compounding algorithm" virkni, væri gaman að skoða nánar við tækifæri

fiktaði talsvert með reynir pakkann fyrir nokkrum árum, og hann var með bín grunninn einmitt pakkaðan inn þar, sem var áhugavert í ljósi hversu grimm árnastofnun var varðandi notkunarskilmála á grunnunum sínum á þeim tíma

annars þakka ég starrið í sumar og þetta innlegg frá þér :)

skál og góða helgi

@Loknar Loknar added the discussion Discussion about project label Sep 10, 2023
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
discussion Discussion about project
Projects
None yet
Development

No branches or pull requests

2 participants