<html xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;
        mso-fareast-language:EN-US;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:#0563C1;
        text-decoration:underline;}
span.EmailStyle17
        {mso-style-type:personal-compose;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-family:"Calibri",sans-serif;
        mso-fareast-language:EN-US;}
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:72.0pt 72.0pt 72.0pt 72.0pt;}
div.WordSection1
        {page:WordSection1;}
--></style>
</head>
<body lang="en-CH" link="#0563C1" vlink="#954F72" style="word-wrap:break-word">
<div class="WordSection1">
<p class="MsoNormal">Hi!<br>
<br>
Firstly, thanks for an amazing repo and great documentation<span lang="EN-US">!</span><br>
<br>
<span lang="EN-US">I have recently downloaded COD using command:<br>
>wget http://www.crystallography.net/archives/cod-cifs-mysql.zip</span><br>
<span lang="EN-US">After unzipping I found cif and mysql directories – as expected.<br>
<br>
Looking at files in mysql entries I caught interest of smiles.txt file. This looks very useful for searching the molecules of interest, especially the organic ones, that I am interested. I assume this relates to this paper (<a href="https://jcheminf.biomedcentral.com/articles/10.1186/s13321-018-0279-6">https://jcheminf.biomedcentral.com/articles/10.1186/s13321-018-0279-6</a>),
 is that correct?<br>
<br>
Counting entries in this file, however, I find the number of entries significantly smaller than the reported number of entries on the title page (“</span>Currently there are 494800 entries in the COD<span lang="EN-US">”):<br>
~/COD/mysql:> wc -l smiles.txt <o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US">> 219646 smiles.txt<br>
<br>
Is this because the file is not being updated, or does that exclude entries that were unable to be converted into SMILES?<br>
<br>
Many thanks for your reply!<br>
<br>
Best wishes,<br>
Vladas<br>
<br>
P.S. Feel free to answer in Lithuanian, if preferred </span><span lang="EN-US" style="font-family:"Apple Color Emoji"">😊</span><o:p></o:p></p>
</div>
<br />-- 
<br />This message has been scanned for viruses and
<br />dangerous content by
<a href="http://www.mailscanner.info/"><b>MailScanner</b></a>, and is
<br />believed to be clean.
</body>
</html>