<html><head></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; ">Hi Bart,<div>sorry to keep coming back to this. But the following sentence from the referred page puzzles me a bit:</div><div><br></div><div>--- snip ---</div><div><span class="Apple-style-span" style="font-family: sans-serif; font-size: 16px; "><p class="line874">The current solution has three known caveats:<span class="anchor" id="line-54"></span></p><ul><li>If the janitor is enabled then you loose the possibility to easily add cluster nodes. (It is still possible but takes detailed knowledge of Jackrabbit.)</li></ul></span><div>--- snip ---</div><div><br></div><div>This does not sound very comfortable to be. It seems to me that it is the janitor that we want, but this warning makes me think we don't want it.</div><div><br></div><div>What do you think?</div></div><div><br><div><div>On Dec 14, 2009, at 3:49 PM, Bart van der Schans wrote:</div><br class="Apple-interchange-newline"><blockquote type="cite"><div>On Mon, Dec 14, 2009 at 2:47 PM, Jettro Coenradie &lt;<a href="mailto:jettro@jteam.nl">jettro@jteam.nl</a>&gt; wrote:<br><blockquote type="cite">Ik am reading this document<br></blockquote><blockquote type="cite"><a href="http://wiki.apache.org/jackrabbit/Clustering">http://wiki.apache.org/jackrabbit/Clustering</a><br></blockquote><blockquote type="cite">Here it is stated that is not trivial to remove journal records.<br></blockquote>Well removing old journal records is trivial in a database (not in a<br>file based journal). The trick is to determine which journal records<br>are "old" (enough to delete).<br><br>Bart<br><br><br><br><blockquote type="cite">I am glad about the possibility to copy indexes, we will give this a go.<br></blockquote><blockquote type="cite">thanks<br></blockquote><blockquote type="cite">On Dec 14, 2009, at 2:08 PM, Bart van der Schans wrote:<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">Hi Jettro,<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">On Mon, Dec 14, 2009 at 1:50 PM, Jettro Coenradie &lt;<a href="mailto:jettro@jteam.nl">jettro@jteam.nl</a>&gt; wrote:<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">Hi All,<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">At the moment we are in the middle of deploying a large hippo installation.<br></blockquote><blockquote type="cite">We have 4 site servers, 2 cms servers with proxies and loadbalancers in<br></blockquote><blockquote type="cite">betweer (for the production only).<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">At the moment we are having issues with moving content from acceptation to<br></blockquote><blockquote type="cite">production. THe content in the database (mysql) is not a lot, maybe around<br></blockquote><blockquote type="cite">3000 items with images and pdf's. At the moment the database dump is 3.5 Gb<br></blockquote><blockquote type="cite">big, of which the journal takes more than 2 Gb. There are not a lot of<br></blockquote><blockquote type="cite">revisions in there, so what will happen to this journal when we are working<br></blockquote><blockquote type="cite">with the system in production for more than a year?<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">You can just drop old journal records/revisions when they are consumed<br></blockquote><blockquote type="cite">by all the nodes in the cluster. So dropping records older than 24<br></blockquote><blockquote type="cite">hours or so should probably be fine. You probably have a daily backup<br></blockquote><blockquote type="cite">anyway. Creating a shell script to do so should be trivial. If I'm not<br></blockquote><blockquote type="cite">mistaken there's also some code inside jackrabbit to do pretty much<br></blockquote><blockquote type="cite">the same, but I haven't tried it yet.<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">Of course the dump itself is not the biggest problem, adding a server to the<br></blockquote><blockquote type="cite">cluster is. We now have assigned 6 Gb to a site with embedded repository<br></blockquote><blockquote type="cite">running, but starting the instance takes for ages and often they just don't<br></blockquote><blockquote type="cite">reach the modus that it can serve webpages at all.<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">Truncating the journal should fix this.<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">We are looking for more information on using clustering mode, one of the<br></blockquote><blockquote type="cite">questions we have has to deal with the lucene index. With a clean server,<br></blockquote><blockquote type="cite">the server needs to obtain all content from the cluster and create it's<br></blockquote><blockquote type="cite">local copy as well as the lucene index. Is it possible to copy files from<br></blockquote><blockquote type="cite">one server to another (the lucene files, or the other repository files)?<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">I'm not sure what you mean with "obtain all content from the cluster".<br></blockquote><blockquote type="cite">If the node has to create it's own index it has to index all the data<br></blockquote><blockquote type="cite">in the database which can take quite a while, especially if you have a<br></blockquote><blockquote type="cite">lot of pdf's.<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">To prevent re-indexing you can stop one node, copy it's index (the<br></blockquote><blockquote type="cite">whole 'repository' folder) and copy it to the new node on the same<br></blockquote><blockquote type="cite">location. Now you can start the node without having to re-index the<br></blockquote><blockquote type="cite">whole database. The nodes will though consume the new journal records<br></blockquote><blockquote type="cite">created during the downtime and update the index accordingly.<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">Regards,<br></blockquote><blockquote type="cite">Bart<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">Ideas and opinions are very welcome<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">regards Jettro Coenradie<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">_______________________________________________<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">Hippo-cms7-user mailing list and forums<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite"><a href="http://www.onehippo.org/cms7/support/community.html">http://www.onehippo.org/cms7/support/community.html</a><br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">--<br></blockquote><blockquote type="cite">Hippo B.V. &nbsp;- &nbsp;Amsterdam<br></blockquote><blockquote type="cite">Oosteinde 11, 1017 WT, Amsterdam, +31(0)20-5224466<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">Hippo USA Inc. &nbsp;- &nbsp;San Francisco<br></blockquote><blockquote type="cite">101 H Street, Suite Q, Petaluma CA, 94952-3329, +1 (707) 773-4646<br></blockquote><blockquote type="cite">-----------------------------------------------------------------<br></blockquote><blockquote type="cite"><a href="http://www.onehippo.com">http://www.onehippo.com</a> &nbsp;&nbsp;- &nbsp;<a href="mailto:info@onehippo.com">info@onehippo.com</a><br></blockquote><blockquote type="cite">-----------------------------------------------------------------<br></blockquote><blockquote type="cite">_______________________________________________<br></blockquote><blockquote type="cite">Hippo-cms7-user mailing list and forums<br></blockquote><blockquote type="cite"><a href="http://www.onehippo.org/cms7/support/community.html">http://www.onehippo.org/cms7/support/community.html</a><br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">Jettro Coenradie - <a href="mailto:jettro@jteam.nl">jettro@jteam.nl</a> - <a href="http://www.jteam.nl">http://www.jteam.nl</a> - blog - linkedin<br></blockquote><blockquote type="cite">Phone: +31(0)20 486 20 36 Fax: +31(0)20 475 08 28 Mobile: +31(0)6 3473 9912<br></blockquote><blockquote type="cite">Frederiksplein 1 - 1017 XK - Amsterdam - The Netherlands<br></blockquote><blockquote type="cite"><br></blockquote><blockquote type="cite">_______________________________________________<br></blockquote><blockquote type="cite">Hippo-cms7-user mailing list and forums<br></blockquote><blockquote type="cite"><a href="http://www.onehippo.org/cms7/support/community.html">http://www.onehippo.org/cms7/support/community.html</a><br></blockquote><blockquote type="cite"><br></blockquote><br><br><br>-- <br>Hippo B.V. &nbsp;- &nbsp;Amsterdam<br>Oosteinde 11, 1017 WT, Amsterdam, +31(0)20-5224466<br><br>Hippo USA Inc. &nbsp;- &nbsp;San Francisco<br>101 H Street, Suite Q, Petaluma CA, 94952-3329, +1 (707) 773-4646<br>-----------------------------------------------------------------<br><a href="http://www.onehippo.com">http://www.onehippo.com</a> &nbsp;&nbsp;- &nbsp;<a href="mailto:info@onehippo.com">info@onehippo.com</a><br>-----------------------------------------------------------------<br>_______________________________________________<br>Hippo-cms7-user mailing list and forums<br><a href="http://www.onehippo.org/cms7/support/community.html">http://www.onehippo.org/cms7/support/community.html</a><br></div></blockquote></div><br><div>


<div><font color="#523790"><b>Jettro Coenradie</b></font> - <a href="mailto:jettro@jteam.nl"><font color="#000000">jettro@jteam.nl</font></a> - <a href="http://www.jteam.nl/"><font color="#000000">http://www.jteam.nl</font></a> - <a href="http://blog.jteam.nl/"><font color="#000000">blog</font></a> - <a href="http://www.linkedin.com/in/jettro"><font color="#000000">linkedin</font></a></div>
<div><font color="#523790"><b>Phone</b></font>: +31(0)20 486 20 36 <font color="#523790"><b>Fax</b></font>: +31(0)20 475 08 28 <font color="#523790"><b>Mobile</b></font>: +31(0)6 3473 9912</div>
<div>Frederiksplein 1 - 1017 XK - Amsterdam - The Netherlands</div>



</div>
<br></div></body></html>